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“This is a great book; This is the book | wish | had written.” 


一 一 Jim Gray， 著 名 数据 库 专家 ，1998 年 图 灵 奖 获得 者 





本 书 系统 介绍 数据 库 和 事务 处 理应 用 的 基本 概念 和 实现 方法 ， 重 点 关注 如 何 构建 数据 库 
应 用 。 书 中 始终 贯穿 关系 数据 库 和 关系 查询 语言 的 基础 理论 ， 为 读者 熟练 掌握 这 些 原理 打下 
坚实 的 基础 。 

为 了 说 明 数 据 库 和 事务 处 理 的 概念 ， 作 者 给 出 了 一 个 贯穿 全 书 的 案例 研究 。 全 书 围绕 如 
何 实现 这 个 案例 介绍 相关 的 技术 和 相应 的 软件 工程 概念 。 

除了 介绍 关系 数据 库 、SQL 和 事务 的 ACID 性 质 之 外 , 本 书 还 了 以 下 有 关 数 据 库 
和 事务 处 理 的 一 些 前 沿 论题 : 

e #AZtSQL, SQL/PSM, ODBC, JDBC#NSQLJ 

© 对 象 和 面向 对 象 数据 库 ， 包 括 SQL:1999、ODMG 以 及 CORBA 

e XML 和 Web 上 的 文档 处 理 

e 触发 器 和 动态 数据 库 

e OLAP 和 数据 挖掘 

e 分 布 式 数据 库 

© TP 监 控 器 以 及 TP 监 控 器 如 何 实现 事务 的 ACID 性 质 

© 不 同 隔离 级 别 上 的 并 发 控制 

e 安全 性 和 电子 商务 





作 aE 。， Stony Brook 的 纽约 州立 大 学 计算 机 科学 系 的 孝 
者 | Philip M. Lewis p 于 1954 年 和 1956 年 在 麻 省 理工 学 院 分 别 区 
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本 书 对 数据 库 和 事务 处 理应 用 的 设计 和 实现 过 程 进行 了 全 面 、 详 细 的 介绍 ， 主 要 内 容 
涉及 数据 库 和 事务 处 理 的 基本 知识 、 数 据 库 管理 、 数 据 库 和 事务 处 理 的 前 沿 主题 等 。 本 书 
的 重点 在 于 如 何 设计 、 实 现 数据 库 与 事务 处 理应 用 ， 而 不 是 实现 数据 库 系统 本 身 ， 强 调 了 
事务 处 理 在 数据 库 系统 中 的 地 位 ， 同 时 保留 了 经 典 关 系数 据 库 理 论 的 体系 框架 。 本 书 篇 幅 
宏大 ， 讲 述 透 彻 ， 适 合作 为 高 等 院 校 计算 机 及 相关 专业 数据 库 及 事务 处 理 课程 的 教材 或 参 
考 书 ， 从 事 数据 库 管理 和 开发 的 技术 人 员 也 可 以 从 本 书 中 了 解 到 所 需 的 知识 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 裴 出 、 独 领 风 骆 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
RIT FEATS, BAAR. AERA, MABE, ROHS 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真 正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 半 选 、 移 译 国 外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 曲 选 出 Tanenbaum Stroustrup, Kernighan, 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 记 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 黑 力 衷 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳 苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 , “计算机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐 浙 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 人 一 个 新 的 阶段 。 为 此 ， 华 章 公 司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 从 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科 技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工 学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 





IV 


这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I. T., Stanford, U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信 与 网 络 、 离 散 数 学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 衰 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 人 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公 司 欢 迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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译 者 序 


从 关系 数据 库 理论 之 发 贺 到 商用 数据 库 管理 系统 的 大 规模 应 用 ， 如 今 , “数据 库 ” 已 经 成 
为 广大 读者 所 熟悉 的 名 词 ， 各 种 数据 库 教 材 不 胜 枚 举 。 本 书 把 抽象 的 数据 库 理论 与 具体 的 应 
用 案例 结合 起 来 ， 从 数据 库 应 用 系统 设计 的 角度 ， 对 数据 库 与 事务 处 理 的 基本 概念 与 理论 进 
行 系统 的 阐述 ， 作 者 们 对 素材 的 选取 和 把 握 ， 给 人 留 下 了 深刻 印象 。 

本 书 的 重点 在 于 如 何 设 计 、 实 现 数据 库 与 事务 处 理应 用 ， 而 不 是 实现 数据 库 管 理 系统 本 
身 ， 强 调 了 事务 处 理 在 数据 库 系统 中 的 核心 地 位 。 同 时 ,保留 了 经 典 关系 数据 库 理论 的 体系 
框架 。 根 据 数据 库 与 事务 处 理 技术 新 的 发 展 ， 本 书 对 Web 数 据 管 理 、 分 布 式 数 据 库 、 数 据 挖 
据 等 新 型 数据 库 技术 进行 了 系统 解析 。 书 中 各 章 都 附 有 大 量 的 习题 与 参考 文献 ， 便 于 读者 研 
习 。 如 作者 们 指出 的 ， 本 书 既 可 以 作为 低 年 级 本 科 生 的 数据 库 基础 课程 教材 ， 也 适宜 作为 研 
究 生 的 高 级 数据 库 与 事务 处 理 教材 。 

本 书 的 第 1 章 ~ 第 5 章 由 陈 金 海 教授 翻译 ， 第 6 章 ~ 第 10 章 、 第 12 章 ~ 第 15 章 由 许 建 军 博士 
翻译 ,第 11 章 、 第 20 章 ~ 第 23 章 由 严 和 平 博士 翻译 ， 第 16 章 ~ 第 19 章 以 及 附录 由 周 向 东 博 士 
翻译 ， 第 24 章 ~ 第 27 章 由 方 锦 城 副 教授 翻译 。 施 伯乐 教授 、 周 向 东 博 士 对 全 书 的 翻译 进行 了 
统 稿 与 审 校 。 

本 书 篇 幅 宏 大 ， 内 容 丰 富 ， 立 意 新 颖 ， 不 仅 覆 盖 了 数据 库 、 事 务 处 理 理论 与 应 用 的 方 方 
面 面 ， 对 与 数据 库 相 关 的 软件 工程 和 操作 系统 的 知识 也 多 有 涉及 。 由 于 译 者 水 平 有 限 ， 难 免 
有 翻译 不 妥 与 错误 之 处 ， 敬 请 广大 读者 、 同 仁 批评 指正 。 
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在 当今 的 信息 社会 中 ， 数 据 库 和 事务 处 理 系统 扮演 着 重要 的 角色 。 事 实 上 ， 我 们 每 天 与 
之 交互 的 任何 大 型 系统 ， 其 核心 都 有 一 个 数据 库 。 这 些 系统 可 能 是 帮助 我 们 处 理 日 常生 活 中 
琐碎 事务 的 系统 (比如 ， 超 级 市 场 付款 系统 )， 也 可 能 是 与 我 们 的 生活 息息相关 的 十 分 重要 的 
系统 (比如 ， 航 空 交通 控制 系统 )。 在 今后 的 几 十 年 中 ， 我 们 会 更 加 依赖 于 这 些 系 统 ， 依 赖 于 
它们 的 准确 性 和 高 效 性 。 

我 们 认为 ， 为 了 设计 、 建 造 、 维 护 和 管理 这 些 高 复杂 性 的 系统 ， 每 一 个 计算 机 科学 家 和 
信息 系统 专家 都 应 该 熟悉 这 些 系统 的 基本 理论 概念 和 工程 概念 。 

本 书 可 以 作为 下 述 课 程 的 教材 : 

。 本 科 生 或 研究 生 的 数据 库 入 门 课程 。 

。 本 科 生 或 研究 生 的 事务 处 理 课程 ， 该 课程 为 已 经 学 过 数据 库 人 门 课 程 的 学 生 开设 。 

。 高 年 级 本 科 生 或 低 年 级 研究 生 的 数据 库 课程 ， 该 课程 为 已 经 学 过 数据 库 入 门 课程 的 学 生 

开设 。 l 

只 要 课程 同时 涵盖 数据 库 和 事务 处 理 的 内 容 ， 教 师 就 可 以 选择 与 两 个 主题 均 相关 的 材料 。 

本 书 更 关注 怎样 构建 应 用 程序 而 不 是 构建 数据 库 管理 系统 本 身 。 我 们 相信 大 部 分 学 生 未 
来 要 实现 应 用 程序 ， 只 有 很 少 一 部 分 学 生 会 去 构建 数据 库 管 理 系 统 。 因 为 事务 处 理 提 供应 用 
程序 访问 数据 库 的 机 制 ， 所 以 我 们 将 把 数据 库 的 知识 放 在 事务 处 理 中 讲解 ， 以 此 来 体现 我 们 
的 教学 重点 。 此 外 ， 本 书包 含 丰富 的 材料 来 描述 事务 用 来 访问 数据 库 的 语言 和 API， 比 如 嵌入 
SQL, ODBCAIDBC, 

本 书 既 包括 一 些 传 统 的 主题 (关系 数据 库 、SQL 和 事务 的 ACID 性 质 )， 也 讨论 比较 前 沿 
的 主题 ， 比 如 对 象 和 对 象 -关系 数据 库 ，XML 和 因特网 文档 处 理 以 及 与 因特网 商务 相关 的 事 
务 问 题 等 。 

尽管 本 书包 含 很 多 数据 库 和 事务 处 理应 用 实例 ， 但 我 们 主要 关心 这 些 主题 下 的 概念 而 不 
是 某 些 商务 系统 和 应 用 程序 的 细节 。 因 而 ， 在 本 书 的 数据 库 知 识 部 分 ， 我 们 着 重 介 绍 与 关系 
和 对 象 数据 模型 相关 的 概念 ， 而 非 商业 数据 库 管 理 系统 的 概念 。 即 使 SQL 被 废弃 ， 这 些 概念 
仍 是 数据 库 处 理 的 基础 。( 回 想 学 习 COBOL 的 那 代 程序 员 ， 他 们 车 学 习 其 他 语言 极为 困难 。) 
类 似 地 , 在 本 书 的 事务 处 理 部 分 , 我们 着 重 介绍 ACID 性 质 的 概念 和 实现 它们 的 有 关 技术 问题 ， 
而 不 是 某 些 商业 数据 库 管理 系统 或 TP 监 控 器 (TP monitor). 

为 加 强 学 生 对 技术 的 理解 ， 我 们 加 入 一 个 事务 处 理应 用 的 案例 研究 (学生 注册 系统 )， 该 
案例 将 贯穿 本 书 始终 。 尽 管 本 书 中 的 学 生 注 册 系 统 并 不 是 非常 有 趣 , 但 它 的 特点 是 : 所 有 的 
学 生 都 作为 用 户 与 这 样 的 系统 交互 过 。 更 重要 的 是 ， 它 是 一 个 内 容 很 丰富 的 应 用 ， 所 以 我 们 
可 以 使 用 它 说 明 很 多 有 关 数 据 库 设计 、 查 询 处 理 和 事务 处 理 的 问题 。 

本 书 的 独特 之 处 在 于 ， 它 介绍 了 实现 事务 处 理应 用 所 需 的 软件 工程 概念 (使 用 学 生 注 册 
系统 作为 例子 )。 由 于 很 多 信息 系统 的 失败 源 于 项 目 管理 不 善 和 应 用 不 适当 的 软件 工程 过 程 ， 
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所 以 我 们 觉得 这 些 主题 应 该 成 为 教学 的 重点 。 我 们 对 软件 工程 问题 的 讨论 很 简短 ， 学 生 可 以 
选择 关于 该 主题 的 课程 深入 学 习 。 我 们 相信 ， 当 学 生 领会 后 ， 他 们 会 更 能 理解 和 应 用 学 习 材 
料 。 因 为 本 课程 不 是 软件 工程 课程 ， 在 课 上 我 们 不 会 对 此 作 全 面 讲解 ， 而 是 让 学 生 自己 去 阅 
读 并 且 要 求 他 们 在 课程 项 目 中 去 实践 软件 工程 。 我 们 将 在 学 生 注册 系统 中 探讨 相关 问题 ， 同 
时 阅 明 数据 库 和 事务 处 理 的 要 点 。 


概述 


本 书 中 的 材料 可 供 三 个 学 期 使 用 。 本 书 的 前 半 部 分 可 用 于 数据 库 课程 。 对 于 完成 了 数据 
库 课程 的 学 生 ， 本 书 的 后 半 部 分 着 重 讲述 事务 处 理 和 数据 库 高 级 主题 。 在 我 所 就 职 的 学 校 ， 
我 们 提供 本 科 (入 门 的 ) 和 研究 生 (高 级 的 ) 两 种 数据 库 课程 ， 同 时 也 提供 本 科 和 研究 生 两 
个 版 本 的 事务 处 理 课程 。 

本 书 分 成 五 个 部 分 ， 这 样 教师 可 以 更 方便 地 组 织 教学 材料 。 我 们 还 有 一 张 “ 各 章 之 间 的 
关系 表 ” 可 以 使 定制 课程 更 加 容易 。 


第 一 部 分 : 绪论 

第 1 章 ~ 第 3 章 包括 入 门 性 的 材料 ， 适 用 于 初级 数据 库 课 程 。 第 1 章 提供 概括 性 的 介绍 。 第 
2 章 简 要 地 说 明 SQL 和 事务 处 理 的 ACID 性 质 。 将 这 些 基础 材料 放 在 书 的 开始 部 分 ， 就 可 以 免 
除 后 面 在 安排 所 讨论 主题 顺序 方面 的 一 些 束缚 。 

第 3 章 讨论 学 生 注册 系统 和 与 其 实现 有 关 的 软件 工程 概念 。 我 们 将 详细 地 讨论 需求 和 规格 
说 明文 档 ， 以 及 用 来 设计 图 形 用 户 界 面 的 应 用 软件 生成 器 的 使 用 。 在 我 所 就 职 的 学 校 所 开设 
的 数据 库 入 门 课程 中 ， 我 们 不 在 课堂 上 讲述 这 些 内 容 ， 而 是 要 求学 生 自己 去 阅读 这 些 材 料 。 
在 学 完 这 一 章 后 我 们 开始 课程 项 目 ， 首 先 要 求学 生 书 写 规格 说 明文 档 。 


第 二 部 分 : 数据 库 管理 


第 4 章 ~ 第 15 章 是 初级 数据 库 课程 的 核心 部 分 。 所 涵盖 的 主题 有 : 

。 关 系 的 概念 和 SQL 的 DDL 特 性 ， 包 括 自 动 约束 检查 。 

。E-R (实体 -联系 ) 模型 和 模式 设计 ， 包 括 将 E-R 图 转换 到 关系 模式 的 方法 (以 及 它们 的 

局 限 性 )。 

。 关 系 代数 、 关 系 演算 和 SQL 的 DML 特 性 ， 特 别 要 关注 通过 关系 代数 和 关系 演算 的 语义 表 

达 复 杂 SQL 查 询 。 

。 函 数 依 赖 和 规范 化 ， 包 括 把 关系 模式 分 解 为 3NF、BCNF 和 4NF 的 算法 。 

。 触 发 器 和 动态 数据 库 ， 包 括 SQL:1999 中 的 触发 器 。 

。 在 传统 编程 语言 中 嵌入 SQL 语句 ， 包 括 马 入 式 SQL、 动 态 SQL、ODBC、JDBC 和 SQLJ。 

还 将 讨论 最 近 为 存储 过 程 而 标准 化 的 语言 SQL/PSM。 

。 数据 和 索引 的 物理 组 织 ， 包 括 B+ 树 、ISAM 和 和 散 列 索引 。 

。 查询 过 程 和 优化 ， 包 括 选择 和 联结 的 算法 ， 以 及 估算 查询 计划 的 代价 的 方法 。 

应 用 到 学 生 注册 系统 的 软件 工程 问题 将 贯穿 于 这 些 章 中 。 在 5.7 节 ， 我 们 讲述 系统 的 数据 
库 设计 ， 包 括 E-R 图 和 关系 模式 。 第 12 章 讲述 设计 文档 、 测 试 计划 文档 和 完成 系统 所 需 的 项 目 
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计划 。 在 12.6 节 ， 我 们 介绍 详细 的 设计 ， 并 举 一 个 JavafJDBC 程 序 片段 的 例子 ， 该 程序 实现 系 
统 的 某 一 个 事务 。 

第 15 章 概述 随后 的 几 章 中 关于 事务 处 理 的 部 分 内 容 。 如 果 课 程 时 间 人 允许 ， 它 可 以 用 来 丰 
富 数据 库 课程 。 


第 三 部 分 : 数据 库 的 高 级 主题 


第 16 章 ~ 第 19 章 包含 高 级 数据 库 课 程 的 部 分 主题 。 高 级 数据 库 课 程 包括 第 三 部 分 的 所 有 
章 和 第 27 章 的 内 容 。 据 我 们 的 经 验 ， 由 于 时 间 紧 张 ， 初 级 数据 库 课 程 很 难 包括 第 7、8、9、10、 
11 和 14 章 ， 所 以 在 高 级 数据 库 课 程 中 也 可 以 加 入 这 些 章 。 第 三 部 分 中 的 主题 有 : 

。 对 象 和 对 象 - 关 系数 据 库 ， 包 括 概 念 模式 、ODMG 数 据 库 、SQL:1999 对 象 - 关 系 扩展 和 

CORBA。 

。Web 文 档 处 理 的 数据 库 问题 ， 包括 对 XML Schema、XPath、XSLT 和 XQuery 的 详细 讨论 。 

。 分 布 式 数据 库 ， 包 括 异 构 和 同 构 系 统 、 多 重 数据 库 、 分 段 、 半 联结 、 全 局 查询 优化 、 查 

询 设计 和 分 布 式 数据 库 设计 。 

。 联 机 分 析 处 理 和 数据 挖掘 ， 包 括 星 型 模型 、CUBE 和 ROLLUP 操 作 符 、 联 合 和 分 类 。 


第 四 部 分 : 事务 处 理 


第 20 章 ~ 第 27 章 和 第 9 章 以 及 第 10 章 的 部 分 内 容 包括 事务 处 理 一 个 学 期 课程 所 需 的 材料 。 
这 些 章 中 的 很 多 实例 都 涉及 学 生 注册 系统 的 设计 ， 我 们 在 第 3 章 、 第 12 章 和 5. 7 节 设 计 该 系统 ，。 
我 们 要 求学 生 阅 读 这 些 材料 。 

第 20 章 详细 讲述 事务 的 ACID 性 质 。 第 21 章 、 第 22 章 描述 多 种 不 同 的 事务 模型 和 在 一 个 分 
布 式 的 异 构 的 C/S (客户 /服务 器 模型 ) 环境 中 事务 处 理 系统 的 体系 结构 。 其 中 的 主题 有 : 

。 事 务 模型 ， 包 括 存储 点 、 链 事务 、 事 务 队 列 、 亥 套 和 多 级 事务 、 分 布 式 事务 、 多 重 数据 

库 系统 和 工作 流 系统 。 

* 事务 处 理 系统 的 体系 结构 ， 包 括 集 中 式 和 分 布 式 数据 库 的 客户 /服务 器 组 织 方式 、 双 层 

和 三 层 体系 结构 、TP 监 控 器 和 事务 管理 器 。 事 务 远程 过 程 调用 和 点 对 点 通信 ， 以 及 它们 

在 事务 处 理 系 统 的 组 织 中 的 使 用 。 

“事务 体系 结构 的 实现 和 因特网 事务 处 理应 用 程序 的 模型 。 

第 23 章 ~ 第 26 章 描述 ACID 性 质 中 的 原子 性 、 隔离 性 和 持 信 性 如 何在 集中 式 和 分 布 式 系统 
中 实现 。 其 主题 包括 : 

。 抽象 数据 库 的 并 发 控制 ,包括 严 格 的 两 跨 锁 、 乐 观 的 并 发 控制 、 基 于 时 间 蕉 的 并 发 控制 

对 象 数据 库 的 并 发 控制 和 为 实现 不 同 的 事务 模型 而 制定 的 加 锁 协议 。 

。 关 系数 据 库 的 并 发 控制 ， 包 括 不 同 隔离 级 别 下 的 加 锁 协 议 、 在 每 个 隔离 级 别 下 正确 和 不 

正确 的 调度 实例 、 粒 度 加 锁 、 索 引 加 锁 和 多 版 本 并 发 控制 ， 其 中 包括 SNAPSHOT 隔 离 

级 别 。 

* 日 志和 恢复 ， 包 括 提前 写 日 志 、 转 储 和 检测 点 。 

“分 布 式 事务 ， 包 括 两 阶段 提交 协议 、 全 局 可 串 行 化 、 全 局 死 锁 以 及 管理 元 余数 据 的 同步 

和 异步 算法 。 





第 27 章 讲述 安全 和 因特网 商务 。 该 章 涉及 下 列 主题 : 

。 对 称 和 非 对 称 加 密 、 数 字 签 名 、 盲 签名 和 证 书 。 

。 用 于 认证 和 和 密 钥 分 发 的 Kerberos 协 议 。 

。 因 特 网 协议 ， 包 括 用 于 认证 和 会 话 加 密 的 SSL 协 议 、 用 于 安全 交易 的 SET 协 议 、 电 子 现 

金 协 议 以 及 保证 货物 原子 性 、 已 验证 交付 和 货币 原子 性 的 协议 。 

第 20 章 ~ 第 27 章 的 目标 是 : 

。 使 学 生 明 白 事务 处 理 系统 的 体系 结构 ， 这 样 他 们 可 以 更 好 地 评估 系统 提供 商 提供 的 功能 。 

。 描 述 实 现 事 务 ACID 性 质 的 代价 ， 该 代价 可 通过 系统 资源 和 性 能 衡量 。 

。 描 述 可 以 减少 代价 的 多 种 技术 。 比 如 粒度 锁 、 索 引 、 反 规范 化 和 表 分 段 。 

“描述 即便 隔离 不 全 时 应 用 程序 仍然 可 以 正确 执行 的 情形 。 例 如 ， 在 隔离 级 别 比 

SERIALIZABLE 稍 弱 时 事务 仍然 可 以 正确 执行 。 . 

本 书 附录 A 中 包括 的 某 些 系统 问题 对 于 理解 本 书 的 部 分 内 容 很 重要 。 其 中 包括 模块 化 系 
统 和 封装 的 基本 原理 、 客 户 / 服 务 器 体系 结构 基础 、 多 路 程序 设计 和 线程 以 及 进程 间 通 信 
基础 。 如 果 学 生 在 先前 的 课程 中 还 没 学 到 上 述 内 容 的 话 ， 教 师 可 以 选择 其 中 的 一 些 内 容 进 
行 介绍 。 

章 与 章 之 间 的 关系 

为 帮助 教师 根据 课程 的 需要 选择 本 书 内容 ， 我 们 用 星 号 标记 一 些 可 跳 过 (但 不 影响 该 章 
整体 结构 ) 的 小 节 。 尽 管 可 跳 过 的 小 节 可 能 有 时 被 后 面 的 材料 所 引用 ， 但 这 些 引用 是 可 以 被 
忽略 的 。 此 外 ， 练 习题 会 根据 其 难度 级 别 用 一 个 或 两 个 星 号 标记 。 

根据 课程 目的 ， 有 多 种 使 用 本 书 的 方式 。 为 指导 教师 安排 课程 ， 表 1 列 出 可 以 包含 在 5 门 
不 同 的 课程 中 的 章 ， 这 5 门 不 同 的 课程 适合 不 同 的 学 生 ， 强 调 了 不 同 的 教学 重点 。 在 这 张 表 里 ， 
“是 ”表明 该 章 中 的 所 有 内 容 都 应 该 包含 在 课程 中 。“ 部 分 ”意味 着 教师 可 以 只 选择 其 中 一 部 
分 进行 讲授 .“ 阅 读 ”表明 该 章 可 以 布置 为 学 生 的 阅读 作业 。 

第 1 列 标记 数据 库 人 门 课 程 所 需 的 章 。 在 该 课程 里 ， 可 能 只 包括 第 8 章 关于 规范 化 的 部 分 
内 容 ， 或 许 只 包括 介绍 性 的 章节 。 类 似 地 ， 第 10 章 只 涵盖 关于 SQL 供 和 宿主 语言 的 不 同方 法 
的 部 分 内 容 一 一 或 许 只 需 包含 适用 于 课程 项 目的 一 种 方法 。 

第 >、3 列 描述 两 门 紧 竣 的 数据 库 入 门 课程 。 第 2 列 的 课程 在 数据 库 应 用 方面 来 展开 课程 材 
料 ， 而 第 3 列 更 面向 理论 。 第 10 章 在 面向 应 用 的 材料 中 提供 更 加 深入 的 规范 化 理论 、 查 询 语言 
基础 和 查询 优化 。 尽 管 我 们 把 这 些 材料 描述 成 面向 理论 的 ， 但 是 它 也 同样 是 面向 系统 的 ， 因 
为 它 包 括 数 据 库 管 理 系 统 设计 的 问题 。 在 我 所 就 职 的 学 校 ， 我 们 选择 这 两 列 当 作 本 科 生 课程 
《如 何 选择 这 两 种 课程 可 根据 教师 的 兴趣 决定 )。 

第 4 列 描述 一 门 高 级 数据 库 课 程 。 在 课程 刚 开始 的 时 候 ， 教 师 可 以 给 学 生 复习 或 补充 他 认 
为 必须 的 人 门 知识 。 这 些 知 识 可 以 在 第 7、8、9、10 和 14 章 中 找到 。 接 下 来 的 课程 讲述 高 级 数 
据 库 主题 和 一 些 在 电子 商务 中 关于 事务 处 理 的 知识 。 在 我 所 就 职 的 学 校 ， 这 门 课程 用 于 研究 
生 教 学 ， 而 研究 生 在 本 科 阶 段 已 经 学 过 数据 库 基础 课程 。 

第 5 列 描述 一 门 事 务 处 理 课程 。 该 课程 也 假设 学 生 已 经 学 过 数据 闫 入 门 课程 。 在 我 所 就 职 
的 学 校 ， 研 究 生 和 本 科 生 都 开设 了 这 门 课程 。 事 务 处 理 的 知识 需要 有 相关 资料 的 补充 。 而 这 








些 资料 ， 比 如 第 9、10 章 中 的 一 些 知 识 ， 可 能 没有 被 包括 进 数据 库 基 础 课程 。 
Rl 5 门 课程 中 所 包含 的 章 


课 程 
章 数据 库 /入 门 数据 库 /应 用 数据 库 / 理 论 数据 库 / 高 级 事务 处 理 
1 是 是 是 是 
2 是 是 是 
3 阅读 阅读 
4 是 是 是 
5 是 是 是 
6 是 是 是 
7 部 分 是 部 分 
8 部 分 部 分 是 部 分 
9 是 是 是 是 
10 部 分 是 部 分 是 
11 是 是 是 
12 阅读 阅读 
13 部 分 是 是 
14 部 分 是 部 分 
15 是 是 是 
16 . 是 
17 是 
18 是 
19 是 
20 是 
21 是 
22 是 
23 是 
24 是 
25 是 
26 是 
27 是 是 


为 进一步 调整 课程 ， 下 面 的 各 章 之 间 关 系 图 可 能 有 所 帮助 ( 见 图 1 )。 该 图 指出 两 种 依赖 
关系 。 实 线 说 明 某 一 章 依赖 于 另外 一 章 中 的 除 可 选 章节 外 的 绝 大 部 分 知识 。 而 虚线 说 明 依赖 
较 弱 ， 也 就 是 说 只 依赖 于 某 章 中 的 一 小 部 分 概念 ， 这 些 概 念 在 课堂 上 可 以 很 快 地 带 过 。 第 27 
章 的 依赖 比较 特殊 ， 它 可 以 安排 在 事务 处 理 课程 的 末尾 ， 因 为 它 依赖 于 第 21、22 和 25 章 ， 也 
可 以 安排 在 数据 库 课程 的 末尾 ， 因 为 它 依赖 于 第 15 章 。 


补充 材料 


除 本 书 之 外 ， 下 面 的 补充 材料 有 助 于 教师 的 教学 工作 : 
。 在 线 的 所 有 章 的 PPT 演 示 文 档 。 

“在 线 的 书 中 所 有 图 的 PPT 幻 灯 片 。 

* 在线 解决 方案 指南 ， 包 括 练习 题 的 答案 。 
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。 我 们 认为 读者 可 能 感 兴趣 的 额外 的 参考 资料 、 注 意 事项 、 勘 误 表 、 家 庭 作业 、 测 验 等 等 。 

要 获得 上 述 补 充 材料 ， 请 访问 本 书 的 网 址 www.aw.com/cssupport。 只 有 教师 (通过 联络 
Addison-Wesley 销 售 代 表 ) 能 得 到 解决 方案 指南 和 PPT。( 读 者 可 登录 华章 网 站 下 载 习 题 答案 
HIPPT.) 
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第 一 部 分 
绪论 


本 书 的 介绍 性 部 分 由 三 章 组 成 。 

在 第 1 章 中 ， 我 们 会 介绍 本 书包 含 的 大 致 内 容 ， 来 激发 读者 对 数 
据 库 与 事务 处 理 的 兴趣 。 

第 2 章 将 介绍 许多 在 数据 库 和 事务 处 理 领域 的 基本 的 技术 性 概念 ， 
包括 SQL 语言 和 事务 的 ACID 性 质 。 我 们 会 在 本 书 的 后 面 详细 讲解 这 
些 概念 。 

第 3 章 开 始 讨论 一 个 案例 研究 : 学 生 注册 系统 ， 该 案例 将 贯穿 于 
本 书 始终 。 我 们 还 会 讨论 许多 涉及 实现 该 系统 的 软件 工程 概念 ， 并 
给 出 该 系统 的 需求 文档 。 





第 1 章 数据 库 和 事务 概述 


1.1 什么 是 数据 库 和 事务 


在 度假 期 间 ， 你 在 东京 一 家 百货 公司 的 收 款 台 前 面 ， 把 信用 卡 递 给 店员 ， 然 后 焦急 地 等 
待 着 你 的 购买 被 批准 。 在 你 等 待 的 短 短 几 秒 钟 内 ， 购 买 信息 已 经 环 游 世界 ， 发 往 一 个 或 多 个 . 
银行 和 票据 交换 所 ， 然 后 访问 和 更 新 数据 库 ， 直 到 系统 批准 了 你 的 购买 为 止 。 每 天 会 有 超过 
两 千 万 的 信用 卡 交 易 在 超过 一 千 万 的 商家 那里 通过 两 万 多 家 银行 进行 处 理 。 这 些 交 易 涉 及 数 
以 亿 计 的 美金 ， 而 期 间 发 生 的 交易 会 当 作 一 条 记录 存储 在 网 络 数据 库 中 。 这 些 数据 库 的 正确 
性 、 安 全 性 和 有 效 性 以 及 访问 数据 库 事 务 的 正确 性 和 性 能 特征 对 整个 信用 卡 业 务 至 关 重 要 。 

1. 什 么 是 数据 库 

准确 地 说 ， 数 据 库 (database) 是 与 某 一 企业 相关 的 数据 项 的 集合 。 例 如 ， 银 行 的 储户 的 
账户 信息 。 数 据 库 可 以 存储 在 Rolodex 的 卡片 里 或 者 文件 柜 的 纸张 里 ， 我 们 尤其 对 按 位 或 字 节 
存储 在 计算 机 里 的 数据 库 感 兴趣 。 这 样 的 一 个 数据 库 可 以 集中 (centralized) 于 一 台电 脑 或 者 
分 布 (distributed) 在 多 台电 脑 里 ， 后 者 可 能 在 地 理 位 置 上 完全 分 开 。 . 

越 来 越 多 的 企业 依赖 于 这 种 数据 库 。 企 业内 没有 纸 介质 的 记录 ， 只 有 当前 情况 的 最 新 记 
录 ( 比 如， 每 个 银行 顾客 的 账户 的 余额 ) 存储 在 数据 库 中 。 很 多 企业 把 他 们 的 数据 库 视 为 最 
重要 的 资产 。 

例如 ， 一 家 生产 飞机 的 公司 的 数据 库 内 含有 工程 设计 、 生 产 过 程 和 十 年 前 生产 飞机 的 部 
件 供 应 商 的 信息 记录 ， 以 及 在 飞机 的 使 用 期 限 中 每 次 检验 的 记录 。 如 果 在 将 来 的 某 次 检验 中 
发 现 某 个 飞机 的 喷气 发 动机 的 涡轮 叶片 发 生 故 障 ， 公 司 可 以 从 数据 库 中 确定 提供 那 种 特殊 引 
擎 的 转 包 商 ， 然 后 该 转 包 商 可 以 从 他 的 数据 库 中 确定 涡轮 叶片 生产 的 日 期 、 生 产 叶片 的 机 器 
和 人 员 ， 制 造 叶 片 的 原材料 来 源 以 及 生产 叶片 时 质量 保证 测试 的 结果 。 用 这 种 办 法 ， 公 司 可 
以 确定 故障 的 原因 ， 提 高 未 来 的 飞机 生产 的 质量 。 有 一 个 详细 的 历史 数据 库 ， 又 可 以 从 数据 
库 中 搜索 到 关于 某 架 十 年 前 生产 的 飞机 上 的 一 个 特定 的 喷气 发 动机 的 一 个 特定 的 涡轮 叶片 的 
结构 的 信息 ， 这 使 得 拥有 这 种 数据 库 的 飞机 生产 商 比 那些 没有 数据 库 的 飞机 生产 商 具 有 更 大 
的 战略 优势 。 

在 某 些 情况 下 ， 数 据 库 是 企业 的 主要 资产 。 例 如 ， 在 一 家 信用 卡 公司 中 ， 当 你 申请 信用 
卡 的 时 候 ， 信 用 卡 公司 就 会 向 他 们 的 数据 库 咨询 。 在 另 一 些 情况 下 ， 数 据 库 信 息 的 准确 性 对 
人 类 生活 至 关 重 要 。 例 如 ， 东 京 机 场 的 航空 交通 管理 系统 所 用 的 数据 库 。 

为 了 能 方便 地 进行 访问 ， 数 据 库 往 往 封 装 在 数据 库 管 理 系 统 (Database Management 
System, DBMS) 中 。 数 据 库 管理 系统 支持 一 种 高 级 语言 ， 应 用 程序 员 使 用 这 种 语言 来 访问 数 
据 库 。 结 构 化 查询 语言 (Structured Query Language, SQL) 是 其 中 使 用 得 最 广泛 的 语言 ， 本 
书 将 介绍 这 种 语言 。SQL 的 特点 在 于 它 是 一 种 自然 描述 语言 : 程序 员 只 需 说 出 要 做 什么 ， 由 
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数据 库 管理 系统 来 解决 怎样 高 效 完成 的 问题 。 数 据 库 管理 系统 解释 每 条 SQL 语句 并 且 按 其 描 
述 执 行动 作 。 程 序 员 不 必 知道 数据 库 的 存储 细节 ， 不 必 明 确 地 描述 执行 访问 的 算法 ， 也 不 必 
关心 管理 数据 库 的 其 他 许多 方面 。 

2. 什 么 是 事务 

数据 库 通常 存储 描述 企业 当前 状态 的 信息 。 例 如 ， 一 家 银行 的 数据 库存 储 每 个 储户 当前 
的 账户 余额 。 当 现实 世界 中 某 一 事件 的 发 生 改变 了 企业 的 状态 ， 存 储 在 数据 库 中 的 信息 必须 
要 做 相应 的 改变 。 在 联机 数据 库 管 理 系统 中 ， 这 些 改变 由 一 种 称 为 事务 transaction ) 的 程序 
实时 地 完成 ， 当 现实 世界 的 事件 发 生 的 时 候 就 会 执行 事务 。 例 如 ， 当 一 个 顾客 在 银行 存款 
(现实 世界 的 一 个 事件 ) 时 ， 存 款 事务 就 会 被 执行 。 每 个 事务 必须 始终 保持 数据 库 状 态 与 真实 
世界 中 企业 之 间 关系 的 正确 性 。 除 了 改变 数据 库 的 状态 ， 事 务 自身 可 能 在 现实 世界 中 也 会 发 
出 一 些 事件 。 例 如 ，ATM 机 的 取款 事务 发 出 供应 现金 的 事件 。 建 立 电话 连接 的 事务 需要 在 电 
话 公司 的 基础 设施 中 获得 资源 (长 途 链接 的 带宽 ) 的 分 配 。 

你 在 东京 度假 时 执行 的 信用 卡 核准 是 事务 的 一 个 例子 。 当 你 预定 航班 的 时 候 ， 航 班 预定 
数据 库 中 的 事务 会 被 执行 。 当 你 通过 机 场 检查 护照 的 时 候 ， 移 民 服 务 数据 库 中 的 事务 会 被 执 
行 。 你 在 旅馆 登记 的 时 候 ， 旅 馆 房间 预定 数据 库 的 事务 就 会 被 执行 。 甚 至 当 你 从 旅馆 房间 打 
电话 到 家 里 报 平安 的 时 候 ， 旅 馆 记 账 数据 库 中 的 事务 就 被 执行 并 建立 电话 连接 。 

其 他 事务 在 执行 时 可 能 经 常 涉及 到 ATM 系 统 、 超 级 市 场 扫描 系统 以 及 大 学 注册 和 记 账 系 
统 。 这 些 事务 越 来 越 多 地 必须 访问 分 布 式 数据 库 ， 即 分 布 在 不 同 地 理 位 置 由 不 同 数 据 库 管 理 
系统 管理 的 多 重 数据 库 。 东 京 旅馆 里 的 电话 事务 就 是 其 中 一 个 例子 。 

3. 什 么 是 事务 处 理 系 统 

管理 事务 和 控制 事务 访问 DBMS 的 系统 称 为 TP 监控 器 (TP monitor)。 一 个 事务 处 理 系统 
(Transaction Processing System, TPS) 通常 由 一 个 TP 监控 器 、 一 个 或 多 个 数据 库 管 理 系统 和 
一 组 包含 多 个 事务 的 应 用 程序 组 成 ( 见 图 1-1)。 数 据 库 是 事务 处 理 系统 的 核心 ， 因 为 它 比 任 
何 一 个 事务 的 生命 周期 都 要 长 。 越 来 越 多 的 企业 依赖 于 这 些 为 他 们 的 业务 而 设置 的 系统 ， 例 
如 ， 有 人 可 能 会 说 信用 卡 事务 处 理 系统 就 是 信用 卡 业务 。 ， 


事务 
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图 1-1 事务 处 理 系统 的 结构 
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1.2 现代 数据 库 和 事务 处 理 系统 的 特点 


.现代 计算 机 和 通信 技术 的 发 展 使 数据 库 和 事务 处 理 系统 的 体系 结构 、 设 计 和 使 用 突 飞 猛 
进 。 下 面 是 新 系统 与 老 系统 之 间 的 比较 。 

。 大 部 分 新 系统 的 数据 库 基 于 关系 模型 (relational model)。 在 关系 模型 中 ， 数 据 存 储 在 
表 中 ， 并 且 可 以 利用 (相对 ) 简单 的 查询 语言 (例如 SQL) 访问 数据 。 使 用 SQL 的 程序 
员 不 必 知 道 复 杂 的 数据 物理 布局 。 相 反 ， 老 的 系统 使 用 复杂 数据 库 模 型 ， 称 为 网 状 模型 
(network model)。 在 网 状 模型 里 ， 数 据 记 录 通 过 复杂 的 指针 结构 链接 ， 而 查询 语言 i 
过 指针 结构 浏览 数据 ， 这 使 得 查询 的 设计 、 编 程 和 测试 都 十 分 复杂 。 

。 很 多 新 系统 中 的 数据 库 可 以 存储 大 型 多 媒体 对 象 ， 例 如 图 片 和 视频 片断 。 如 此 产生 了 新 
一 代 的 应 用 ， 比 如 基于 因特网 的 目录 和 数字 百科 全 书 。 老 数据 库 只 能 存储 文字 和 数字 类 
型 的 数据 ， 只 限于 少数 种 类 的 应 用 。 | 

。 大 多 数 新 系统 是 联机 的 (online )， 然 而 一 些 老 的 系统 经 常 成 批 执 行 数据 库 的 文件 备份 。 
例如 ， 当 你 在 一 台 ATM 机 (联机 地 ) 上 执行 取款 操作 的 时 候 ， 在 拿 到 钱 之 前 取款 事务 

将 (实时 地 ) 扣除 你 账户 中 的 资金 。 相 反 ， 在 老 的 系统 中 ， 取 款 操作 需要 在 出 纳 员 窗 
口 使 用 取款 单 来 执行 ， 并 且 银 行 在 下 午 2 点 关门 ， 以 便 银行 数据 库 在 晚上 ( 脱 机 地 ) 更 

” 新 数据 。 

。 大 部 分 新 系统 允许 多 个 事务 并 发 访问 (concurrent access) 数据 库 。 结 果 ， 事 务 会 实时 
地 交叉 执行 。 另 一 方面 ， 老 的 系统 只 允许 顺序 访问 (sequential access) 数据 库 ， 即 一 个 
事务 只 能 在 前 一 个 事务 完成 以 后 才能 执行 。 当 事务 顺序 执行 的 时 候 ， 如 果 有 大 量 的 事务 
试图 访问 数据 库 ， 事 务 从 提交 到 完成 之 间 的 平均 时 间 延 时 会 急剧 地 增加 。 每 分 钟 执行 的 
事务 的 数量 同样 也 会 下 降 。 对 于 联机 系统 ， 这 种 延 时 会 变 得 无 法 忍受 ， 而 并 发 事务 处 理 
可 以 给 用 户 提供 更 快速 的 响应 时 间 。 

“很 多 新 系统 涉及 分 布 式 计算 (distributed computation )。 随 着 计算 机 硬件 价格 的 下 降 ， 
对 于 一 家 企业 来 说 ， 把 电脑 设备 分 布 在 多 个 场地 已 经 变 得 比较 经 济 。 随 着 通信 价格 的 下 
降 ， 将 这 些 站 点 互 连 也 已 经 变 得 很 经 济 。 特 别 是 现在 用 户 所 用 的 终端 已 经 相当 智能 并 且 
能 积极 地 参与 到 全 局 计算 中 。 另 一 方面 ， 在 老 的 系统 中 只 有 极 少量 的 计算 (如 数据 格式 
化 ) 在 终端 完成 ， 因 此 它们 被 称 为 哑 终 端 ， 而 中 央 计 算 机 (central computer) 集中 了 全 
部 的 智能 。 例 如 ，ATM 终 端的 计算 机 收集 取款 操作 所 需 的 信息 ， 然 后 才 与 银行 的 计算 机 
交互 ， 最 后 响应 从 银行 计算 机 发 来 的 分 配 现金 的 请 求 。 

“。 很 多 新 系统 涉及 到 分 布 式 数据 (distributed data)。 随 着 存储 设备 价格 的 下 降 ， 企 业已 经 
可 以 在 不 同 部 门 维护 各 自 的 数据 库 。 数 据 的 分 布 可 能 反映 出 企业 的 组 织 结构 ， 如 果 企 业 
在 地 理 上 是 分 散 的 ， 数 据 可 能 分 布 到 应 用 最 频繁 的 站 点 。 相 反 ， 老 的 系统 把 所 有 的 数据 
存储 在 中 心 位 置 。 例 如 ， 你 的 信用 卡 账 户 可 能 存储 在 某 一 个 站 点 ， 然 而 商场 的 账户 存储 
在 另外 一 个 不 同 的 站 点 。 在 信用 卡 批准 事务 期 间 ， 两 个 站 点 都 会 被 访问 到 。 

。 老 的 系统 是 同 构 的 (homogeneous ) ， 只 涉及 到 单个 厂商 的 模块 。 因 此 ， 兼 容 性 不 会 有 问 
题 ， 模 块 之 间 可 以 直接 互 连 。 很 多 新 系统 是 异 构 的 (heterogeneous ) ， 涉 及 到 不 同 厂商 
生产 的 硬件 和 软件 模块 。 系 统 变 得 “开放 ”， 随 之 而 来 的 竞争 导致 厂商 生产 出 更 好 的 产 
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品 。 结 果 ， 行 业 接 口 标准 的 发 展 是 目前 的 主要 问题 。 . 
。 在 老 的 系统 中 ， 事 务 主要 由 业务 人 员 在 办 公 场 所 执行 。 因 特 网 把 事务 处 理 带 到 了 家 中 ， 
这 样 导致 事务 处 理 系统 的 数量 以 及 被 执行 的 事务 的 数量 呈 爆 炸 性 增长 。 在 商业 和 我 们 日 
常生 活 中 ， 这 种 新 功能 将 产生 深远 意义 。 

上 述 特性 充分 提升 了 数据 库 和 事务 处 理 系统 的 功能 ， 在 许多 场合 下 这 将 给 企业 带 来 
重要 的 新 的 商业 机 会 。 反 过 来 ， 新 功能 预示 着 运行 这 些 系统 需要 大 量 的 额外 需求 。 
“高 有 效 性 (availability) ”因为 系统 是 联机 的 ， 所 以 当 企业 在 营业 的 时 候 ， 它 必须 每 时 
每 刻 都 可 以 使 用 。 在 一 些 企业 中 ， 这 意味 着 系统 必须 一 直 可 以 使 用 。 例 如 ， 航 班 预定 系 
统 可 能 要 跨 很 多 时 区 接受 从 售票 处 传 来 的 航班 预定 请 求 ， 所 以 系统 永 不 关闭 。 相 反 ， 脱 
机 银行 系统 下 的 事务 只 在 银行 营业 期 间 执行 。 联 机 系统 中 的 故障 会 导致 营业 中 断 ， 如 果 
航班 预定 系统 的 电脑 发 生 了 故障 ， 乘 客 就 不 能 预定 机 票 。 企 业 容忍 故障 的 能 力 依赖 于 企 
业 自 身 的 性 质 。 显 然 ， 飞 行 控 制 系统 比 航班 预定 系统 更 难 忍 受 系 统 故 障 。 高 有 效 性 系统 
通常 与 硬件 和 软件 的 配置 有 关 。 

。 高 可 靠 性 (reliability) ”系统 必须 准确 地 反映 所 有 事务 的 结果 。 这 意味 着 不 仅 必须 正确 
地 编写 事务 ,而 且 必 须 保证 不 能 由 于 事务 并 发 执行 或 者 事务 执行 时 模块 之 间 的 通信 而 引 
入 错误 。 而 且 ， 大 型 分 布 式 事务 处 理 系 统 包括 成 千 上 万 个 硬件 和 软件 模块 ， 所 有 模块 都 
能 正确 地 运作 的 可 能 性 不 大 。 除 了 发 生 灾难 性 的 故障 ， 系 统 必须 不 能 丢失 任何 已 完成 的 
事务 的 结果 。 例 如 ， 银 行 系统 的 数据 库 必须 能 精确 地 反映 所 有 存款 操作 和 取款 操作 完成 
后 的 效果 ， 不 能 因为 随后 的 系统 崩溃 而 寺 失 任何 事务 的 执行 结果 。 

* HAUER (high throughput) ”因为 企业 拥有 很 多 必须 使 用 事务 处 理 系 统 的 顾客 ， 所 以 系 
统 必须 有 能 力 每 秒 钟 执行 大 量 的 事务 。 例 如 ， 信 用 卡 核准 系统 在 最 繁忙 的 时 段 可 能 每 秒 
钟 执 行 上 千 个 事务 。 正 如 我 们 将 会 看 到 的 ， 这 种 需求 意味 着 事务 不 能 顺序 执行 ， 而 必须 
并 发 执行 。 这 样 会 使 系统 设计 变 得 很 复杂 。 

“ 低 响 应 时 间 (low response time) ”因为 顾客 要 等 待 系统 的 响应 ， 所 以 系统 必须 能 快速 地 
响应 。 应 用 不 同 ， 响 应 需求 也 会 不 同 。 尽 管 你 可 能 愿意 忍受 15 秒 钟 时 间 等 待 ATM 机 吐出 
现金 ， 但 是 你 却 期 望 电话 在 不 多 于 1 秒 或 2 秒 的 时 间 内 完成 连接 。 此 外 ， 在 一 些 应 用 中 ， 
如 果 在 固定 的 一 段 时 间 内 没有 得 到 响应 ， 事 务 就 不 能 正确 执行 。 例 如 ， 在 工厂 自动 化 系 
统 中 ， 可 能 要 求 事务 在 传送 带 上 的 某 一 元 件 通 过 一 个 特殊 的 位 置 之 前 启动 一 个 设备 。 这 . 
种 类 型 的 应 用 被 称 为 具有 硬 实时 (hard real-time) 约束 。 

“长 生命 周期 (long lifetime) ”事务 处 理 系 统 很 复杂 ， 不 能 被 轻易 地 替换 。 它 们 必须 能 把 
单独 的 硬件 或 软件 模块 用 新 版 本 《执行 得 更 好 或 有 更 多 的 功能 ) 替换 ， 而 周围 的 系统 不 
必 做 大 量 的 改动 。 

“安全 性 (security) 许多 事务 处 理 系统 包含 个 人 的 私人 信息 《例如 ， 他 们 所 购 的 商品 
他 们 的 信用 卡号 码 、 他 们 看 过 的 视频 以 及 他 们 的 健康 记录 和 财务 记录 )。 因 为 这 些 系统 
可 以 在 许多 地 方 (可 能 通过 因特网 ) 被 许多 人 访问 ， 所 以 安全 变 得 至 关 重 要 。 用 户 必 须 
要 经 过 认证 (他 们 是 否 就 是 他 们 所 声称 的 人 )， 用 户 只 能 执行 他 们 被 授权 可 以 执行 的 那 
些 事 务 (只 有 银行 出 纳 员 可 以 执行 一 个 产生 保 付 支票 的 事务 )， 数 据 库 内 的 信息 必须 不 
能 被 攻击 者 破坏 或 读 取 ， 并 且 用 户 与 系统 之 间 传输 的 信息 必须 不 能 被 自 改 或 被 窃听 。 
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本 书 关心 的 是 数据 库 和 事务 处 理 系统 的 技术 方面 的 知识 ， 特 别 关 注 应 用 程序 的 设计 和 实 
现 的 内 容 ， 包 括 应 用 程序 数据 库 的 组 织 ， 但 是 不 关心 算法 和 实现 DBMS 与 事务 处 理 系统 模块 
的 底层 数据 结构 。 然 而 ， 我 们 必须 非常 熟悉 这 些 底层 系统 ， 这 样 我 们 才能 在 应 用 程序 中 巧妙 
地 使 用 它们 。 


13 实现 和 支持 数据 库 与 事务 处 理 系 统 的 主要 成 员 


事务 处 理 系统 和 它 所 关联 的 数据 库 可 以 是 一 个 非常 复杂 的 由 硬件 和 软件 组 成 的 组 合 物 ， 
很 多 不 同类 型 的 人 以 不 同 的 角色 与 之 进行 交互 。 通 过 检查 这 些 角 色 就 可 以 很 好 地 理解 什么 是 
事务 处 理 系统 。 首 先 考 虚 事 务 处 理 系统 的 设计 和 实现 所 涉及 到 的 人 员 。 

系统 分 析 员 ”系统 分 析 员 与 应 用 系统 的 顾客 合作 ， 规 划 出 系统 的 正式 需求 和 规格 说 明文 
档 。 他 必须 既 能 理解 企业 的 业务 规则 ， 又 能 理解 数据 库 和 事务 处 理 系统 技术 的 底层 实现 ， 这 
样 的 应 用 系统 才 既 能 满足 顾客 的 需要 ， 又 能 高 效 地 执行 。 然 后 ， 其 他 角色 根据 由 系统 分 析 员 
给 出 的 规格 说 明 来 详细 地 设计 出 数据 库 格式 和 访问 数据 库 的 事务 。 

数据 库 设计 师 数据 库 设计 师 需 指定 适合 应 用 系统 的 数据 库 结构 。 数 据 库存 储 着 描述 真实 
世界 应 用 的 现状 的 信息 。 数 据 库 结构 必须 支持 事务 所 要 求 的 访问 ， 而 且 人 允许 访 问 及 时 地 执行 。 

应 用 程序 员 应 用 程序 员 实 现 图 形 用 户 界面 和 系统 中 的 事务 。 他 必须 保证 事务 能 维持 真实 
世界 应 用 的 状态 和 数据 库 状态 之 间 的 一 致 。 应 用 程序 员 与 数据 库 设计 师 共 同 保证 管理 企业 工 
作 的 规定 能 强制 执行 。 例 如 ， 在 学 生 注册 系统 中 ， 注 册 一 门 课程 的 学 生 人 数 不 能 超过 分 配给 
这 门 课程 的 教室 的 座位 个 数 。 

项 目 经 理 项 目 经 理 负责 成 功 地 完成 实现 项 目 。 他 需要 准备 时 间 进度 表 和 预算 , 分 配 人 员 ， 
以 及 监督 日 常 的 项 目 运作 。 项 目 管理 的 难度 极 大 。 据 斯 坦 迪 什 集 团 (The Standish Group, — 
个 信息 技术 的 咨询 集团 ) 对 超过 8000 个 IT 项 目的 大 范围 的 调查 ， 结 果 表明 只 有 16% 的 项 目 在 
时 间 和 预算 上 能 成 功 地 完成 。 其 失败 的 首要 原因 就 是 拙劣 的 项 目 管理 9 。 

与 运作 的 事务 处 理 系统 交互 (而 不 是 构建 ) 的 人 员 如 下 所 示 。 

用 户 用 户 通过 与 图 形 化 用 户 界面 交互 ， 执 行 单独 的 事务 。 用 户 界面 必须 能 适合 未 来 用 户 
的 需求 。 例 如 ，ATM 机 的 用 户 界面 简单 ， 一 般 人 在 没有 经 过 训练 或 指导 的 情况 下 通过 屏幕 上 
显示 的 信息 就 可 以 执行 存款 和 取款 操作 。 相 反 ， 航 空 公司 的 职员 或 旅行 社 代理 人 需要 经 过 高 
级 训练 才能 使 用 航班 预定 系统 的 界面 。 但 无 论 是 上 述 哪 种 情况 ， 系 统 的 复杂 性 都 被 屏蔽 了 。 

数据 库 管 理 员 数据 库 管理 员 负 责 在 系统 运行 时 对 数据 库 提供 支持 。 他 需要 关注 的 是 为 数 
， 据 库 分 配 存储 空间 ， 监 控 和 优化 数据 库 性 能 ， 监 控 和 控制 数据 库 安全 。 另 外 ， 数 据 库 管理 员 
可 能 需要 修改 数据 库 结构 以 适应 企业 内 的 变化 或 处 理性 能 瓶颈 。 

系统 管理 员 系统 管理 员 负 责 在 系统 运行 时 对 系统 提供 支持 。 他 (她 ) 必须 了 解 以 下 情况 : 

。 系统 体 系 结构 在 任何 时 候 ， 哪 些 硬件 和 软件 模块 连接 到 系统 ， 以 及 它们 怎样 互 连 ? 

“KEEL 每 台 机 器 中 各 个 软件 模块 的 版 本 是 多 少 ? © 

“AERA 系统 是 否 运行 良好 ? 哪些 系统 和 通信 链接 是 可 运作 的 或 拥挤 的 ， 需 要 做 哪些 

O 对 于 大 型 公司 ， 成 功率 降 为 9%。 对 于 延 时 完工 或 超过 预算 的 项 目 ， 平均 完工 时 间 是 计划 时 间 的 222%， 平 


均 花 费 是 预算 的 189%。 令 人 惊讶 的 是 ，31% 的 项 目 在 完工 之 前 就 被 取消 。 关 于 这 个 称 为 “Chaos” 的 调查 
的 信息 ， 可 参考 [Standish 2000]。 . 
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工作 改善 拥挤 的 状况 ? 系统 当前 执行 情况 怎样 ? 

本 书 主要 关注 应 用 层面 。 所 以 ， 我 们 特别 关注 系统 分 析 员 、 应 用 程序 员 和 数据 库 设计 师 
这 些 角 色 。 然 而 ， 工 作 在 应 用 层 的 人 员 要 想 充分 利用 底层 系统 的 性 能 ， 也 最 好 能 了 解 其 他 的 
角色 。 


1.4 决策 支持 系统 一 一 OLAP 和 OLTP 


数据 库 并 不 只 在 事务 处 理应 用 领域 扮演 关键 性 角色 ， 它 还 在 决策 支持 (decision support) 
领域 扮演 重要 角色 。 事 务 处 理 使 用 一 个 数据 库 来 维护 一 个 映射 现实 世界 状态 的 精确 的 模型 ， 
而 决策 支持 使 用 数据 库 内 的 信息 来 指导 管理 决策 。 为 了 阐明 这 两 个 领域 之 间 的 区 别 ， 我 们 来 
讨论 全 国 性 连锁 超级 市 场 中 的 角色 。 

1. 事务 处 理 

连锁 店 的 每 个 超级 市 场 都 维护 一 个 数据 库 来 存储 它 所 销售 的 所 有 商品 的 价格 和 当前 库存 
信息 。 超 市 内 的 结账 柜台 使 用 数据 库 (以 条 形 码 扫描 器 ) 作为 其 事务 处 理 系统 的 一 部 分 。 该 
系统 的 一 个 事务 可 能 是 “购买 三 块 Campbel 香 所 和 一 盒 乐 之 人 饼干 ; 计算 价格 ， 打 印 收据 ， 更 
新 现金 抽 屠 内 的 余额 ， 在 商店 库存 中 删 去 这 些 商 品 .” 顾 客 希望 该 事务 能 在 儿 秒 钟 内 完成 。 

事务 处 理 系 统 的 主要 目标 是 维护 数据 库 与 真实 世界 状况 一 致 。 真 实 世界 中 的 事件 被 建 模 
为 事务 。 在 该 例 中 ， 事 件 是 顾客 购物 ， 真 实 世 界 的 状况 是 商店 的 库存 和 现金 抽 居 内 的 现金 
总 数 。 

2. 决策 支持 

超级 市 场 连锁 店 的 经 理 可 能 希望 分 析 每 个 分 店 的 数据 库 数 据 ， 来 帮助 他 们 为 整个 连锁 店 
做 出 决策 。 因为 企业 期 望 把 他 们 数据 库 中 的 数据 转化 为 对 他 们 制定 长 期 战略 目标 有 用 的 信息 息 ， 
所 以 这 种 决策 支持 应 用 变 得 越 来 越 重 要 。 

决策 支持 的 应 用 需要 查询 一 个 或 多 个 数据 库 ， 之 后 可 能 要 对 查询 返回 的 信息 做 一 些 数学 
分 析 。 决 策 支 持 应 用 有 时 被 称 为 联机 分 析 处 理 (Online Analytic Processing, OLAP ) ， 与 此 形 
成 对 比 的 是 我 们 先前 讨论 过 的 联机 事务 处 理 (Online Transaction Processing, OLTP) 应 用 。 

在 一 些 决策 支持 的 应 用 中 ， 查 询 很 简单 ， 可 以 作为 OLTP 应 用 所 使 用 的 本 地 数据 库 中 的 事 
务 来 实现 。 例 如 , “打印 第 27 分 店 过 去 六 个 月 内 每 周 产品 销售 的 报告 。” 

然而 ， 在 许多 应 用 中 查询 十 分 复杂 ， 在 本 地 数据 库 下 不 能 有 效 地 执行 。 它 们 可 能 执行 时 
间 过 长 〈 因 为 数据 库 已 经 为 OLTP 事 务 优化 )， 并 导致 本 地 事务 (例如 ， 结 账 事务 ) 执行 得 很 
慢 。 因 此 ， 超 级 市 场 连锁 店 要 为 这 样 的 复杂 OLAP 查 询 维护 一 个 单独 的 数据 库 。 数 据 库存 储 所 
有 分 店 过 去 十 年 的 销售 和 库存 的 历史 信息 。 这 些 信 息 从 分 店 数据 库 在 不 同 的 时 间 内 抽取 出 来 ， 
每 天 更 新 一 次 。 这 样 的 数据 库 称 为 数据 仓库 (data warehouse). . 

连锁 店 经 理 可 以 输入 复杂 的 关于 数据 仓库 数据 的 查询 。 例 如 ,“ 在 过 去 五 年 的 冬季 月 份 内 ， 
位 于 东北 城市 的 超级 商场 的 顾客 买 饼干 同时 又 买 香皂 的 比例 是 多 少 ? ”( 可 能 这 两 个 商品 就 放 
置 在 相近 的 货架 上 . ) 

数据 仓库 可 以 存储 1TB (10 字 节 ) 的 数据 ， 所 以 需要 特殊 的 硬件 来 维护 那些 数据 。 
OLAP 查 询 可 能 很 难 明 确 地 表达 ， 因 而 需要 使 用 比 OLTP 查 询 功能 更 强大 的 查询 语言 概念 。 
OLAP 查 询 通常 没有 严格 的 执行 时 间 的 限制 ， 可 能 执行 一 次 查询 需要 几 个 小 时 。 数 据 仓库 可 以 
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通过 结构 化 来 加 快 查询 的 执行 速度 。 数 据 库 只 需要 定期 更 新 ， 因 为 这 种 类 型 的 查询 没 必 要 精 
确 到 分 钟 级 别 一 一 即使 数据 库 没有 达到 100% 的 准确 ， 查 询 也 可 以 得 到 满意 的 回答 。 

3. 数据 挖 报 

经 理 可 能 也 对 结构 化 不 太 高 的 查询 感 兴趣 。 例 如 ,“ 顾 客 是 否 喜欢 同时 购买 这 些 商 品 ? ” 
这 样 的 查询 称 为 数据 挖 拥 (data mining )。 与 OLAP 相 比 ，OLAP 的 查询 需要 带 有 特殊 信息 ， 而 
数据 挖掘 可 以 被 看 作 是 知识 发 现 一 一 尝试 从 数据 库 数据 中 抽取 新 知识 。 

数据 挖掘 查 询 更 难于 明确 地 表达 ， 可 能 要 用 到 人 工 智能 领域 中 高 深 的 数学 技术 。 一 个 查 
询 的 执行 可 能 需要 多 个 小 时 ， 可 能 还 需要 与 经 理 交互 来 获得 额外 的 信息 或 者 重新 构造 部 分 的 
查询 。 

数据 挖掘 有 一 个 被 广泛 流传 的 却 有 可 能 是 虚构 的 成 功 故事 。 便 利 连锁 商店 使 用 上 述 的 查 
询 (“顾客 是 否 喜 欢 同时 购买 ……”) 发 现 了 一 个 意外 的 关联 : 在 傍晚 ， 买 尿布 的 男 顾 客 通常 
会 同时 购买 啤酒 一 一 大 概 这 些 顾 客 是 晚上 在 家 里 要 照顾 婴儿 的 父亲 。 

我 们 在 第 19 章 将 进一步 讨论 OLAP 和 数据 挖掘。 


1.5 练习 


1.1 举 出 三 个 你 在 过 去 的 一 个 月 内 与 之 交互 过 的 事务 处 理 系统 。 在 每 个 系统 中 你 执行 了 哪些 事务 ， 现 实 

世界 中 的 哪个 事件 触发 了 事务 的 执行 ?你 的 事务 导致 数据 库 发 生 了 哪些 变化 ? 

除了 书 中 所 提 到 的 ， 举 出 三 类 的 严重 依赖 于 事务 处 理 系统 的 企业 。 写 出 每 个 企业 的 事务 处 理 系统 的 

简单 描述 以 及 企业 怎样 依赖 于 这 些 系统 。 

举 出 超级 市 场 使 用 联机 扫描 结账 系统 后 可 以 获得 的 三 个 额外 好 处 。 例 如 ， 他 们 可 以 知道 哪些 商品 被 

一 同 购买 。 . 

14 有 些 超级 市 场 给 用 户 积 分 卡 ， 当 结账 的 时 候 扫描 积分 卡 ， 并 且 自 动 给 用 户 优惠 折扣 。 ， 
a. 举 出 超级 市 场 从 该 系统 中 可 获得 的 三 个 好 处 (不 包括 节省 处 理 优惠 券 的 开销 )。 例 如 ， 他 们 可 以 

知道 你 买 了 什么 商品 ， 然 后 把 相关 广告 寄 给 你 。 
b. 写 出 三 个 OLAP 查 询 用 于 处 理 这 些 数 据 。 

1.5 解释 为 什么 服装 厂 经 常 访问 主要 百货 公司 联机 结账 系统 的 数据 库 。 

1.6 跨国 公司 的 信息 系统 通常 要 保证 一 天 二 十 四 小 时 一 周 七 天 都 可 用 。 为 什么 ? 

1.7 对 下 列 每 个 应 用 需求 ， 给 出 三 个 实例 : 

a. 高 可 靠 性 系统 
b. 高 吞吐 量 系 统 
c. 低 响应 时 间 系 统 
1.8 解释 下 述 现象 : 
a. 为 什么 你 用 于 保存 支票 账户 的 支票 夭 是 一 个 数据 库 ? 
b. 你 的 支票 铸 数 据 库 与 银行 中 关于 你 的 支票 账户 的 部 分 数据 库 是 怎样 关联 的 ? 

1.9 解释 为 什么 工厂 里 的 联机 原料 跟踪 系统 比 白天 把 信息 保存 在 文件 中 ,晚上 再 把 信息 输入 计算 机 的 脱 
机 系统 更 精确 。( 也 就 是 解释 脱 机 系统 中 的 数据 为 什么 在 每 天 早晨 更 精确 而 不 是 一 整 天 都 很 精确 ) 
例如 ， 任 何 输入 错误 一 旦 出 现 ， 就 可 以 被 检测 到 并 且 立 即 纠正 。 

1.10 你 所 在 的 学 校 计划 一 个 新 的 自动 学 生 注 册 系 统 。 作 为 可 能 的 用 户 ， 你 被 邀请 与 系统 分 析 师 会 面 ， 
进行 系统 的 需求 分 析 。 


iy 


io 
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a. 你 会 推荐 哪些 对 学 生 有 用 的 事务 ?包括 一 些 查询 事务 ， 学 生 可 以 从 系统 中 询问 一 些 信息 。 
b. 从 这 些 事务 中 选择 一 个 ， 并 且 概 述 一 下 用 户 与 事务 交互 的 界面 设计 。 
c. 除 了 学 生还 有 哪些 类 型 的 用 户 ? 你 认为 他 们 需要 哪些 事务 ? . ` 
.1.11 a. 在 上 一 个 习题 描述 的 学 生 注册 系统 中 ， 系 统管 理 员 可 能 使 用 的 OLAP 查 询 有 哪些 ? 请 给 出 三 个 
例子 。 
b. 给 出 一 个 数据 挖掘 查询 的 例子 。 
1.12 如 果 你 在 因特网 网 站 填写 一 个 详细 的 多 页 的 注册 表格 ， 很 多 网 站 会 提供 赠品 。 为 什么 ? 





2.1 案例 研究 : 学 生 注册 系统 


你 所 在 的 大 学 希望 实现 一 个 学 生 注册 系统 ， 以 便 学 生 可 以 在 他 们 的 家 庭 电 脑 上 注册 课程 。 
要 求 你 建造 该 系统 的 原型 作为 本 书 的 项 目 。 广 册 人 员 已 经 准备 了 如 下 的 系统 目标 陈述 
(statement of objectives ) 。 

学 生 注册 系统 的 目标 是 允许 学 生 和 相关 的 教师 完成 如 下 操作 : 

1) 认证 他 们 为 系统 的 用 户 。 

2) 注册 (下 一 学 期 的 ) 课程 。 

3) 获得 某 一 学 生 情况 的 报告 。 

4) 维护 关于 学 生 和 课程 的 信息 。 

5) 学 生 完 成 课程 后 ， 输 入 该 学 生 最 终 的 成 绩 。 

上 述 的 简单 描述 可 以 作为 系统 实现 项 目的 出 发 点 ， 但 是 它 还 不 够 明确 和 详细 ， 所 以 不 能 
够 作为 项 目 设 计 和 编码 阶段 的 基础 。 我 们 将 贯穿 全 书 介绍 如 何 开 发 学 生 注册 场景 ， 并 且 用 它 
来 曾 明 数据 库 和 事务 处 理 中 各 种 不 同 的 概念 。 

下 一 步 将 结合 注册 人 员 、 教 师 和 学 生来 扩展 上 述 的 简单 描述 ， 使 之 成 为 正式 的 系统 需求 
文档 (requirements document)。( 第 3 章 将 讨论 需求 文档 。) 然而 ， 在 完成 这 一 工作 之 前 ， 我 们 
将 深入 介绍 数据 库 和 事务 处 理 的 一 些 基 本 概念 。 


2.2 关系 数据 库 概 述 


大 多 数 事务 处 理 系统 把 数据 库 放 在 中 心 位 置 。 在 每 一 时 刻 ， 数 据 库 必 须 保 存 有 现实 世界 
中 由 事务 处 理 系统 模型 化 的 企业 的 精确 描述 ， 通 常 是 唯一 的 精确 描述 。 例 如 ， 在 学 生 注 册 系 
统 中 ; 数据 库 是 关于 每 门 课程 被 哪些 学 生 注册 的 信息 的 唯一 来 源 。 

我 们 特别 关注 使 用 关系 模型 (relational model) [Codd 1970, 1990] 的 数据 库 ， 其 数据 存储 
ER (table) 中 。 例 如 ， 学 生 注册 系统 包含 STUDENT 表 ， 见 图 2-1。 表 拥有 一 组 行 (rw). € 
图 2-1 中 ， 每 行 包 含 一 名 学 生 的 信息 。 表 的 每 个 列 (column) 只 描述 学 生 的 某 一 方面 的 信息 。 
在 例子 中 ， 列 为 4H、Name、Address 和 Status。 每 列 有 一 个 关联 类 型 ， 称 为 该 列 的 域 (domain ) ， 
每 行 在 该 列 的 值 都 来 自 这 个 域 。 例 如 ，Id 的 域 是 整 型 ， 而 Name 的 域 是 字符 串 型 。 

这 个 数据 库 模 型 被 称 为 “关系 ”模型 ， 是 因为 它 基 于 关系 的 数学 概念 。 数 学 关系 
(mathematical relation) 获得 的 是 这 样 一 个 概念 : 不 同 集合 的 元 素 彼 此 相关 。 例 如 ， 人 名 
(Name) 集合 里 的 一 个 元 素 John Doe 与 地 址 (Address) 集合 里 的 一 个 元 素 123 Main St. 相 关 ， 
也 与 Id 集合 里 的 一 个 元 素 111111111 相 关 。 关 系 是 元 组 (tuple) 的 集合 。 在 STUDENT 表 的 例子 
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中 ， 我 们 可 以 定义 一 个 包含 元 组 (111111111, John Doe, 123 Main St., Freshman) 的 称 为 
STUDENT 的 关系 。STUDENT 关 系 假 定 包含 描述 每 个 学 生 信息 的 元 组 。 


111111111 John Doe 123 Main St. Freshman 
666666666 Joseph Public 666 Hollow Rd. 
111223344 1 Lake St. 
987654321 Fox 5 TV 
023456789 Fox 5 TV 
123454321 6 Yard Ct. 




























Sophomore 









Mary Smith Freshman 











Bart’ Simpson Senior 












Homer Simpson Senior 








Joe Blow Junior 





图 2-1 STUDENT 表 。 每 行 描述 一 个 学 生 


关系 可 以 看 作 谓 词 。 谓 词 (predicate) 是 一 个 或 真 或 假 的 声明 性 语句 ， 其 真 假 依赖 于 其 参 
数 的 值 。 例 如 ， 谓 词 “ 在 X 天 Detroit 地 区 下 雨 了 ”的 真 假 依赖 于 为 X 参 数 所 选择 的 值 。 当 把 关 
系 看 作 谓 词 时 ， 谓 词 的 参数 对 应 于 元 组 里 的 元 素 ， 并 且 只 有 当 元 组 正好 在 关系 里 时 ， 谓 词 被 
定义 为 真 。 这 样 ， 我 们 可 以 定义 STUDENT 谓 词 并 且说 STUDENT (111111111, John Doe, 123 
Main St., Freshman) 为 真 。 谓词 为 真意 味 着 Id 为 111111111 的 人 的 名 字 不 会 是 Bill Smith, 因此 
包含 值 111111111 和 Bill Smith 的 元 组 不 在 SrupENT 关 系 中 。 

表 与 关系 的 对 应 性 现在 已 经 清楚 了 : 关系 的 元 组 对 应 于 表 的 行 ， 表 的 列 名 也 是 关系 的 属 
性 (attribute) 名 。 这 样 ，STUDENT 表 的 行 可 以 看 作 枚 举 所 有 满足 STUDENT 关 系 (也 就 是 ， 
StudId、Name、Address 和 Status ) 的 四 元 组 (有 四 个 属性 的 元 组 ) 的 集合 。 

在 现实 应 用 中 ， 表 可 能 很 大 ， 大 学 的 一 张 SrupENT 表 可 能 超过 一 万 五 千 行 ， 并 且 每 行 可 能 
含有 比 目 前 显示 的 更 多 的 关于 每 一 个 学 生 的 信息 。 除 了 SrupENT 表 外 ， 大 学 的 学 生 注册 系统 的 
整个 数据 库 可 能 包含 许多 其 他 的 表 ， 每 个 表 又 含有 许多 行 ， 以 便 存 储 学 生 注册 的 其 他 方面 的 
信息 。 因 此 ， 大 部 分 的 应 用 数据 库 包含 大 量 的 信息 ， 通 常 保存 在 大 容量 存储 设备 中 。 

在 大 多 数 应 用 中 ， 数 据 库 由 数据 库 管 理 系 统 控制 ， 而 数据 库 管理 系统 由 销售 商 提供 。 当 
一 个 应 用 程序 想 对 数据 库 执 行 一 个 操作 时 ， 它 需要 向 DBMS 发 出 一 个 请 求 。 一 个 典型 的 操作 
可 能 是 从 一 张 或 多 张 表 中 抽取 一 些 信 息 ， 修 改 一 些 行 ， 或 者 增加 、 删 除 一 些 行 。 

除了 数据 库 中 的 表 可 以 由 数学 关系 建 模 外 ， 对 表 的 这 些 操 作 也 可 以 建 模 为 相应 关系 上 的 
数学 运算 。 这 样 ， 某 个 特定 的 一 元 操作 可 能 把 表 T 作 为 一 个 参数 ， 并 且 产 生 一 个 含有 表 T 的 行 
的 子 集 的 结果 表 。 某 个 特定 的 二 元 操作 可 能 把 两 个 表 作 为 参数 ， 并 且 产 生 一 个 含有 两 个 参数 
表 的 行 的 并 集 的 结果 表 。 关 于 数据 库 的 一 个 复杂 查询 可 能 等 同 于 一 个 涉及 在 许多 表 上 进行 的 
多 个 关系 操作 的 表达 式 。 

通过 这 样 的 数学 表达 ， 关 系 操作 可 以 被 精确 地 定义 ， 并 且 可 以 证 明 它们 的 数学 性 质 ( 例 
如 交换 性 和 结合 性 )。 正 如 第 14 章 我 们 将 会 看 到 的 ， 这 种 数学 表达 具有 很 重要 的 实践 意义 。 商 
业 DBMS 包 含 一 个 查询 优化 器 (query optimizer) 模块 ， 该 模块 可 以 把 查询 转换 为 关系 操作 表 
达 式 ， 然 后 使 用 它们 的 数学 性 质 来 简化 这 些 表 达 式 ， 这 样 就 可 以 优化 查询 的 执行 。 

应 用 程序 希望 用 DBMS 支 持 的 语言 来 描述 DBMS 代 表 它 进行 的 数据 访问 。 我 们 特别 关注 
SQL，SQL 是 最 通用 的 数据 库 语 言 ， 为 访问 关系 数据 库 提供 了 便利 ， 并 得 到 几乎 所 有 的 商业 
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DBMS 的 支持 。 

操纵 数据 的 SQL 语 句 的 基础 结构 十 分 简单 并 且 易 于 理解 。 每 条 语句 使 用 一 个 或 多 个 表 作 
为 参数 并 且 产 生 一 个 表 作为 结果 。 例 如 ， 为 了 找到 Id 为 987654321 的 学 生 姓 名 ， 我 们 可 以 使 用 
这 样 的 语句 

SELECT Name 


FROM STUDENT 
WHERE Id = '987654321' 


更 准确 地 说 ， 这 个 语句 要 求 DBMS 从 FROM 子 句 指定 的 表 (也 就 是 STUDENT 表 ) 中 抽取 所 
有 满足 WHERE 子 句 的 条 件 (也 就 是 Id 列 的 值 为 987654321) 的 行 ， 然 后 从 每 行 中 删除 
SELECT 子 句 中 没有 出 现 的 列 (也 就 是 只 保留 Name 列 )。 产 生 的 行 放置 在 由 语句 产生 的 结果 表 
中 。 在 这 个 例子 中 ， 因 为 Id 唯一 ， 最 多 只 有 一 行 可 以 满足 条 件 ， 所 以 该 语句 的 结果 是 一 个 只 
有 一 列 并 且 最 多 只 有 一 行 的 表 。 由 此 可 知 ，FROM 子 句 指定 使 用 哪些 表 作 为 输入 ，WHERE 子 
句 指 定 结果 表 中 行 必须 满足 的 条 件 ，SELECT 子 句 指 定 行 的 哪些 列 作 为 结果 表 的 输出 结果 ，。 

由 上 述 例子 产生 的 结果 表 只 包含 一 列 并 且 最 多 只 有 一 行 。 下 面 看 一 个 稍微 复杂 一 些 的 例子 : 


SELECT Id, Name 
FROM STUDENT (2.2) 
WHERE Status = ‘senior’ 


返回 的 结果 表 ( 见 图 2-2) 包含 两 列 和 多 个 行 : 所 有 大 学 四 年 级 (senior) 学 生 的 Id 和 姓名 。 如 
果 和 希望 产生 一 张 包含 STUDENT 表 的 所 有 列 但 只 描述 大 学 四 年 级 学 生 的 表 ， 我 们 可 以 使 用 语句 
SELECT + - 


FROM STUDENT 
WHERE Status = 'senior' 


BS (*) 是 一 个 简单 的 速记 符 ， 表 示 列 出 STUDENT 表 的 所 有 列 。 
在 一 些 情况 下 ， 用 户 不 关心 输出 的 结果 表 而 关心 结果 表 中 的 信息 。 下 面 的 语句 就 是 一 个 
例子 : 


SELECT COUNT(*) 
FROM STUDENT 
WHERE Status = ‘senior’ 


这 个 语句 返回 结果 表 中 行 的 个 数 (也 就 是 ， 大 
学 四 年 级 学 生 的 人 数 )。COUNT 称 为 聚合 


(aggregate) 函数 ， 因 为 它 产生 结果 表 中 所 有 art Sin 


987654321 Bart Simpson 
023456789 | Homer Simpson 
行 的 个 数 的 函数 值 。 需 要 注意 的 是 ， 当 使 用 育 


合 函数 时 ，SELECT 语 句 产生 的 是 单个 值 而 不 图 22 SQL SELECT fy (2.2) 
BKR. | 返回 的 数据 库 表 

WHERE 子 句 是 SELECT 语句 中 最 有 趣 的 部 分 。 它 包含 一 个 一 般 条 件 来 对 FROM 子 句 中 指 
定 的 表 的 每 一 行进 行 判定 。 行 的 列 值 被 代入 条 件 中 得 到 一 个 值 为 真 或 假 的 表达 式 。 如 果 条 件 
判定 为 真 ， 该 行将 被 保留 下 来 提供 给 SELECT 子 句 进行 处 理 ， 然 后 存储 到 结果 表 中 。 因此， 
WHERE 子 句 起 到 过 滤器 的 作用 。 

条 件 可 能 远 比 我 们 迄今 为 止 所 见 到 的 更 加 复杂 。 条 件 可 以 是 许多 条 件 项 的 布尔 (Boolean) 


(2.1) 
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组 合 。 例 如 ， 如 果 和 希望 结果 是 关于 Id 在 一 定 范围 内 的 大 学 四 年 级 学 生 的 信息 的 表 ， 可 以 用 子 名 
WHERE Status = 'senior' AND Id > '888888888' 
也 可 以 使 用 OR 和 NOT。 此 外 ，SQL 语 言 提 供 了 大 量 的 谓词 用 于 表达 特殊 的 关系 。 例 如 ， 
IN 谓词 测试 集合 成 员 。 
WHERE Status IN ('freshman', 'sophomore') 
其 他 的 聚合 函数 和 谓词 以 及 更 加 复杂 的 WHERE 子 句 将 在 第 6 章 讨论 。 
结果 表 可 以 包含 从 若干 个 基本 表 中 抽取 的 信息 。 这 样 ， 如 果 我 们 有 一 个 TRANSCRIPT 表 ， 
该 表 有 列 StudId，CrsCode，Semester 和 Grade， 则 语句 


SELECT Name, CrsCode, Grade 
FROM STUDENT, TRANSCRIPT 
WHERE StudId = Id AND Status = 'senior' 


产生 的 结果 表 ， 每 行 包 含 一 个 大 学 四 年 级 学 生 (senior) 的 名 字 、 她 选 的 某 门 课程 以 及 她 所 获 
得 的 成 绩 。 首 先 注意 ， 结 果 表 中 的 属性 值 来 自 于 不 同 的 基本 表 : Name 来 自 于 STUDENT 表 ; 
CrsCode 和 Grade 来 自 于 TRANSCRIPT 表 。 其 次 ， 语 句 保证 TRANSCRIPT 表 中 表示 某 个 学 生 的 行 与 
STUDENT 表 中 对 应 的 行 相关 。 这 由 WHERE 子 句 的 第 一 个 合 取 项 来 保证 ， 上 例 中 WHERE 语句 
的 条 件 使 得 两 个 表 的 行 的 Id 值 匹 配 。 例 如 ， 如 果 TRANSCRIPT 有 一 行 (987654321 ，CS305 ， 
F1995，C)， 它 只 能 匹配 STUDENT 表 中 的 Bart Simpson 的 行 ， 最 终 在 结果 表 中 产生 一 行 (Bart 
Simpson, CS305, C). 

SQL 的 一 个 非常 重要 的 特点 就 是 程序 员 不 必 详细 地 指定 DBMS 实 现 某 个 查询 所 用 的 算法 。 
例如 ， 表 的 定义 中 经 常 包含 一 些 辅 助 性 的 数据 结构 ， 称 为 索引 ， 它 的 作用 是 不 必 对 表 进 行 漫 
”长 的 扫描 就 可 以 定位 特定 的 行 。 这 样 ，STUDENT 表 的 一 个 Id 列 的 索引 可 能 是 一 个 包含 (Id, 
pointer) 对 的 列表 ， 其 中 pointer 指 向 表 中 对 应 Id 的 行 。 如 果 建 立 这 样 的 索引 ，DBMS 将 自动 使 
用 这 些 索引 来 查找 满足 查询 (2.1) 的 行 。 如 果 表 包含 Status 列 的 素 引 ， 则 DBMS 将 使 用 这 个 索 
引 来 查找 满足 查询 (2.2) 的 行 。 如 果 Status 列 的 索引 不 存在 ， 则 DBMS 将 自动 使 用 一 些 其 他 方 
法 来 满足 (2.2)。 例 如 ， 它 可 能 检查 表 中 的 每 一 行 来 找到 所 有 Status 列 的 值 为 Senior 的 行 。 程 
序 员 不 必 指 定 使 用 哪个 方法 ， 只 需 指出 结果 表 必 须 满足 的 条 件 即 可 。 

除了 选择 使 用 适当 的 索引 ， 查 询 优化 器 还 使 用 关系 运算 的 性 质 进一步 提升 查询 处 理 的 效 
率 (这 些 也 不 用 程序 员 和 干涉)。 然 而 ， 程 序 员 应 该 对 DBMS 用 于 满足 查询 的 策略 有 一 些 了 解 ， 
这 样 他 们 才能 设计 出 符合 应 用 程序 需要 的 ， 能 够 有 效 执行 的 数据 库 表 、 索 引 和 SQL 语句 。 

下 列 三 个 SQL 语句 用 于 修改 表 的 内 容 。 语 名 


UPDATE STUDENT 
SET Status = 'sophomore' 
WHERE Id = '111111111' 


更 新 STUDENT 表 ， 使 John Doe 成 为 一 个 大 学 二 年 级 学 生 (sophomore). 44 


INSERT 
INTO STUDENT (Id，Name，Address，Status) 
VALUES ('999999999', ，'Winston Churchill', '10 Downing St', 


'senior') 


在 STUDENT 表 中 插入 一 个 描述 Winston Churchill 学 生 的 新 行 。 语 句 
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DELETE 
FROM STUDENT 
WHERE Id = '111111111' 


从 STUDENT 表 中 删除 记录 学 生 John Doe 信 息 的 行 。 这 些 操 作 的 执行 细节 也 不 必 程 序 员 加 以 指定 。 
STUDENT 表 本 身 可 以 用 下 面 SQL 语 名 执行 创建 。 


CREATE TABLE STUDENT( 


Id INTEGER, 
. Name CHAR(20), 

Address CHAR(50), (2.3) 

Status CHAR(10), 

PRIMARY KEY (Id) ) 


在 该 语句 中 ， 我 们 声明 了 每 个 列 的 名 称 和 存储 在 列 中 的 数据 的 域 (类 型 )。 我 们 也 声明 了 Id 列 
作为 表 的 主键 (primary key ) 。 主 键 意味 着 表 的 每 行 在 该 列 的 值 唯一 ， 并 且 DBMS 也 会 (RE 
可 能 ) 自动 地 为 该 列 创建 一 个 索引 。DBMS 会 强制 执行 唯一 性 约束 ， 不 允许 任何 INSERT 或 
UPDATE 语 句 产生 一 个 Id 值 已 经 存在 的 新 行 。 这 是 完整 性 约束 (integrity constraint) 也 称 为 一 
致 性 约束 (consistency constraint) 的 一 个 例子 。 完 整 性 约束 是 一 个 基于 应 用 的 对 数据 库 项 的 
值 的 约束 。 下 一 节 将 详细 讨论 完整 性 约束 。 

我 们 已 经 为 每 个 语句 类 型 给 出 简单 的 例子 ， 从 而 突出 SQL 基本 思想 在 概念 上 的 简单 性 ， 
但 是 我 们 应 该 知道 整个 语言 还 有 很 多 微妙 的 地 方 。 每 种 语句 类 型 都 有 大 量 的 选项 ， 从 而 进行 
非常 复杂 的 查询 和 更 新 。 基 于 这 个 原因 ， 掌 握 SQL 需 要 付出 巨大 的 努力 。 第 4 章 将 继续 讨论 关 
系数 据 库 和 SQL。 


2.3 怎样 使 程序 成 为 事务 


在 许多 应 用 中 ， 数 据 库 用 于 建立 真实 世界 中 的 一 些 企业 状态 的 模型 。 在 这 样 的 应 用 中 ， 
事务 是 一 种 为 了 维持 企业 状态 与 数据 库 状态 一 致 的 与 数据 库 交 互 的 程序 。 特 别 是 ， 事 务 为 了 
响应 真实 世界 中 影响 企业 状态 的 事件 而 执行 对 数据 库 的 更 新 。 例 如 ， 银 行 中 的 存款 事务 。 事 
件 可 能 是 顾客 给 出 纳 员 现金 和 存单 ， 事 务 为 响应 存储 事件 而 更 新 数据 库 中 顾客 的 账户 信息 。 

然而 ， 事务 不 只 是 一 种 普通 的 程序 。 它 们 必须 满足 一 些 要 求 、 特 别 是 它们 执行 的 方式 超 
过 了 对 非 事务 程序 的 通常 要 求 。 

一 致 性 (Consistency) ”事务 访问 和 更 新 数据 库 时 必须 遵守 所 有 的 数据 库 完 整 性 约束 。 每 
个 现实 企业 都 有 一 定 的 企业 制度 ， 这 些 制度 限制 了 企业 的 一 些 可 能 状态 。 例 如 ， 注 册 一 门 课 
程 的 学 生 数 不 能 超过 分 配给 这 门 课 的 教室 的 座位 数 。 如 果 存 在 这 样 的 规则 ， 就 可 以 限制 数据 
库 的 一 些 可 能 状态 。 

可 以 把 限制 声明 为 完整 性 约束 。 对 应 于 上 述 规 则 的 完整 性 约束 断言 : 数据 库 中 关于 课程 
的 注册 学 生 的 项 的 值 不 能 超过 关于 教室 容量 的 项 的 值 。 这 样 ， 当 注册 事务 完成 后 ， 数 据 库 必 
须 满 足 这 个 完整 性 约束 假设 事务 开始 的 时 候 也 满足 约束 )。 

尽管 我 们 还 没有 设计 学 生 注册 系统 的 数据 库 ， 但 是 我 们 可 以 给 出 一 些 要 存储 的 数据 的 设 
想 并 且 假 定 一 些 额外 的 完整 性 约束 。 

"IC0 数据 库存 储 每 个 学 生 的 Id4。 这 些 Id 必须 唯一 。 

"IC1 数据 库 包含 每 学 期 必修 课程 的 列表 和 每 个 学 生 完整 课程 的 列表 。 没 有 选 满 必修 课 
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程 的 学 生 不 能 注册 相关 课程 。 

“IC2 数据库 包含 每 门 课 程 最 多 允许 注册 的 学 生 数 和 每 门 课程 已 经 注册 的 学 生 数 。 每 门 

课程 已 经 注册 的 学 生 数 不 能 大 于 这 门 课程 最 多 允许 注册 的 学 生 数 。 

“IC3 ”从 数据 库 中 确定 某 门 课程 已 经 注册 的 学 生 数 有 两 种 可 能 方式 这 个 数值 作为 总 数 

存储 在 课程 信息 中 ， 它 也 可 以 从 描述 学 生 信息 的 记录 中 计算 注册 该 课程 的 学 生 记 录 的 总 

数 而 获得 。 这 两 种 确定 方式 必须 产生 相同 的 结果 。 

除了 维护 完整 性 约束 外 ， 每 个 事务 必须 更 新 数据 库 使 得 新 数据 库 状态 反映 被 建 模 的 现实 
企业 的 状态 。 如 果 John Doe 注 册 CS305 课 程 ， 但 是 注册 事务 却 记录 Mary Smith 为 班级 里 的 新 学 
生 ， 完 整 性 约束 虽然 满足 了 ， 但 是 新 状态 不 正确 。 因 此 ， 一 致 性 具有 两 个 方面 的 含义 。 


一 致 性 事务 设计 者 可 以 假设 当 事 务 开始 执行 的 时 候 ， 数 据 库 状 态 满足 所 有 完整 性 约 
束 。 设 计 者 有 责任 保证 当 执行 完成 后 数据 库 状 态 再 一 次 满足 完整 性 约束 ， 并 且 新 状 


态 反 映 事 务 规格 说 明 中 所 描述 的 变化 。 





SQL 为 事务 设计 者 在 维护 一 致 性 方面 提供 一 些 支 持 。 当 数据 库 设 计 完 后 ， 数 据 库 设 计 者 
可 以 指定 某 些 类 型 的 完整 性 约束 并 且 把 它们 包含 在 数据 库 表 的 格式 声明 语句 中 。SQL 语 名 
(2.3) 的 主键 约束 就 是 一 个 这 样 的 例子 。 此 后 ， 当 每 个 事务 执行 的 时 候 ，DBMS 自 动 检查 是 否 
违反 任何 指定 的 约束 ， 并 且 阻 止 任何 违反 约束 的 事务 的 完成 。 

原子 性 (Atomicity) ”除了 事务 设计 者 要 负责 一 致 性 外 ，TP 监 控 器 还 必须 为 事务 的 执行 
方式 提供 某 种 的 保证 。 其 中 一 个 这 样 的 条 件 就 是 原子 性 。 


原子 性 系统 必须 保证 事务 和 要么 完全 执行 完 要 么 没有 执行 ， 如 果 事务 没有 执行 完 ， 则 


不 能 产生 任何 效果 (就 像 它 根 本 没有 执行 一 样 )。 





在 学 生 注册 系统 中 ， 一 个 学 生 要 么 已 经 注册 了 一 门 课程 ， 要 么 他 没有 注册 。 部 分 注册 没 
有 意义 而 且 可 能 导致 数据 库 状 态 不 一 致 。 例 如 ， 正 如 约束 IC3 所 指出 的 ， 当 学 生 注册 时 ， 数 据 
库 中 两 项 信息 必须 同时 更 新 。 如 果 注 册 事 务 只 执行 到 一 半 ， 此 时 一 个 更 新 已 经 完成 但 是 在 进 
行 第 二 个 更 新 之 前 系统 崩溃 ， 结 果 数据 库 就 会 不 一 致 。 

当 一 个 事务 成 功 完成 ， 我 们 说 它 已 经 提交 (commit)。 如 果 事 务 没 有 成 功 完成 ， 我 们 称 它 
已 经 异常 中 止 (abort) ， 并 且 系 统 有 责任 保证 不 管事 务 对 数据 库 做 了 哪些 部 分 改动 ， 这 些 改 动 
都 必须 被 撤销 ， 或 称 为 回 退 (roll back)。 事 务 的 原子 执行 意味 着 每 个 事务 要 么 提交 要 么 异常 
中 止 。 

需要 注意 的 是 ， 普 通 程序 没有 必要 具有 原子 性 。 例 如 ， 当 程序 正在 更 新 文件 时 ， 系 统 崩 
省 了 ， 那 么 当 系统 再 恢复 之 后 ， 文 件 处 于 部 分 被 更 新 的 状态 。 

持久 性 (Durability) 事务 处 理 系统 的 第 二 个 要 求 是 它 不 能 丢失 信息 。 


持久 性 条 统 必须 保证 一 旦 事务 提交 ， 事 务 执行 后 的 效果 应 永久 保持 在 数据 库 中 ， 即 
使 计算 机 或 数据 库 的 存储 媒质 发 生 故 障 其 至 崩 清 ， 也 不 能 丢失 执行 结果 。 





例如 ， 如 果 你 成 功 注册 了 一 个 课程 ， 你 一 定 希望 系统 即使 崩溃 还 能 记 住 你 注册 过 的 课程 。 
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注意 ， 普 通 程序 也 没有 必要 具有 持久 性 。 例 如 ， 如 果 一 个 程序 成 功 地 更 新 完 文件 后 ， 存 储 媒 
质 发 生 故 障 ， 文件 存储 的 可 能 不 是 更 新 过 的 数据 。 

隔离 性 (Isolation) ”在 讨论 一 致 性 的 时 候 ， 我 们 关注 单个 事务 的 执行 效果 。 接 下 来 我 们 
检查 多 个 事务 的 执行 效果 。 如 果 一 个 事务 集 内 的 事务 在 另外 一 个 事务 执行 完 后 才 开 始 执行 ， 
我 们 称 这 个 事务 集 是 顺序 (serially) 地 执行 的 。 顺 序 执行 的 好 处 是 ， 如 果 所 有 的 事务 是 一 致 
的 并 且 数据 库 初始 化 时 就 处 于 一 致 性 状态 下 ， 则 顺序 执行 将 保持 一 致 性 . 当 事 务 集合 中 的 第 
一 个 事务 开始 执行 的 时 候 ， 数 据 库 处 于 一 致 性 状态 下 ;因为 事务 是 一 致 的 ， 所 以 该 事务 执行 
完 后 数据 库 将 仍然 是 一 致 的 。 因 为 第 二 个 事务 开始 执行 的 时 候 数据 库 是 一 致 的 ， 所 以 事务 仍 
将 正确 执行 。 如 此 不 断 往复 。 

顺序 执行 对 那些 没有 高 性 能 需求 的 应 用 来 说 已 经 足够 。 然而， 许多 应 用 有 严格 的 响应 时 
间 和 吞吐 量 要 求 ， 唯 一 能 够 满足 这 种 需求 的 是 并 发 执行 事务 。 现 代 计算 机 系统 有 能 力 同 时 执 
行 多 个 事务 ， 我 们 把 这 种 类 型 的 执行 方式 称 为 并 发 。 对 服务 于 多 个 用 户 的 事务 处 理 系统 来 说 ， 
并 发 执行 是 一 种 恰当 的 方式 。 在 这 种 情况 下 ， 在 任何 给 定 的 时 刻 都 有 许多 正在 执行 的 却 只 部 
分 完成 的 事务 。 

在 并 发 执行 中 ， 不 同事 务 的 数据 库 操作 高 效 及 时 地 交替 执行 ， 如 图 2-3 所 示 。 事 务 T, 交 幸 
地 使 用 它 的 局 部 变量 计算 并 向 数据 库 系统 发 送 请 求 ， 在 数据 库 和 它 的 局 部 变量 之 间 传 输 数 据 . 
请 求 按 序 列 op1, ，op1s 产 生 。 我 们 把 这 种 序列 称 为 一 个 事务 调度 (transaction schedule), Ts 以 
类 似 的 方式 执行 计算 。 因 为 两 个 事务 不 同时 执行 ， 所 以 操作 到 达 数 据 库 的 顺序 ( 称 为 调度 
(schedule ) ) 是 两 个 事务 调度 的 任意 排序 。 图 中 的 调度 是 op ， oP;2.1, Op;22, Op12。 


T, 输 出 的 数据 库 
操作 顺序 







Op Op12 
输入 到 DBMS 的 
数据 库 操作 顺序 






OP).1 OP2 1 OP22 OP1.2 


图 2-3 在 并 发 调度 中 两 个 事务 的 数据 库 操作 可 以 交错 输出 
(注意 ， op1i 第 一 个 到 达 DBMS， 然后 是 op; 等 等 ) 


当 事 务 并 发 执行 的 时 候 ， 每 个 事务 的 一 致 性 不 能 充分 保证 数据 库 正确 反 胰 企业 的 状态 
例如 ， 假 设 T, 和 T, 是 注册 事务 的 两 个 实例 ， 由 两 个 想 注册 同一 个 课程 的 学 生发 起 。 图 2-4 显 示 
了 这 两 个 事务 的 一 个 可 能 调度 ， 时 间 从 左 到 右 ， 符 号 rtcur_reg: m) 表 示 事 务 读 取 数据 库 对 象 
cur_reg 的 值 并 返回 值 n， 其 中 cur.reg 记 录 当 前 的 注册 人 数 (符号 w(cur reg: n) 的 意义 类 似 )。 
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图 中 只 显示 对 cur_reg 的 访问 。 。 


T,: r(cur_reg: 29) w(cur_reg: 30) 





T,: r(cur_reg: 29) w(cur_reg: 30) 


图 2-4 没有 相互 隔离 的 两 个 注册 事务 的 一 个 调度 


假定 最 多 可 注册 学 生 的 人 数 是 30 并 且 当 前 的 注册 人 数 是 29。 第 一 步 ， 两 个 事务 都 读 取 当 
前 注册 人 数 并 存储 在 局 部 变量 中 ， 然 后 两 个 事务 都 认为 课程 还 没有 达到 最 多 人 数 。 第 二 步 ， 
每 个 事务 都 对 自己 保存 的 当前 注册 人 数 的 局 部 变量 增值 ， 因 此 ， 它 们 都 计算 得 到 30。 在 写 操 
作 过 程 中 ， 他 们 都 把 相同 的 值 30 写 入 cur_reg。 

两 个 事务 都 成 功 地 完成 ， 但 是 当前 注册 人 数 错误 地 记录 为 30， 而 事实 上 注册 人 数 是 31 OR 
管 允 许 的 最 大 值 是 30)。 我 们 通常 称 这 种 例子 为 更 新 丢失 (lost update) ， 因 为 其 中 一 个 增 量 丢失 
了 。 结 果 数 据 库 不 能 反映 现实 的 状态 ， 并 且 违 反 了 完整 性 约束 IC2。 相 反 ， 如 果 事 务 顺序 执行 ， 
在 T: 人 允许 执行 之 前 Ti 已 经 执行 完毕 ，T: 会 发 现 课 程 注 册 人 数 已 达 最 大 并 且 不 允许 学 生 注册 。 

正如 这 个 例子 所 演示 的 ， 我 们 必须 对 并 发 执行 指定 一 些 约束 来 保证 维护 数据 库 的 一 致 性 
以 及 企业 状态 和 数据 库 状 态 之 间 的 一 致 性 。 下 面 就 是 这 样 的 一 个 完全 充分 的 约束 条 件 。 


隔离 性 即使 事务 并 发 执行 ， 调 度 的 整体 效果 必须 等 同 于 在 菜 一 次 序 下 事务 顺序 执行 


的 效果 。 





这 种 需求 的 确切 意义 将 在 第 1!5、23 和 24 章 中 阐明 。 然 而 ， 显而易见 的 是 ， 如 果 事 务 是 一 
致 的 ， 并 且 如 果 并 发 调度 的 整体 效果 等 同 于 某 一 顺序 调度 的 效果 ， 那 么 该 并 发 调度 将 保持 一 
臻 性。 满足 这 一 条 件 的 并 发 调度 称 为 可 串 行 化 (serializable )。 

隔离 性 通常 要 求 事务 给 某 个 数据 库 项 加 锁 才 能 实现 。 如 果 这 些 锁 必 须 保持 一 个 较 长 的 时 
间 段 ， 则 其 他 的 事务 可 能 必须 等 待 ， 直 到 持 有 锁 的 事务 执行 完毕 为 止 ， 这 样 既 增加 了 响应 时 
间 又 减少 了 吞吐 量 。 对 于 某 些 应 用 来 说 这 是 无 法 接受 的 。 为 了 能 适应 这 些 应 用 ， 大 多 数 商业 
DBMS 提 供 隔离 性 等 级 的 执行 选项 ， 这 不 同 于 可 串 行 化 也 不 同 于 串 行 执行 。 我 们 将 在 第 10、 
15 和 24 章 讨论 这 些 选项 。 

和 原子 性 、 持 和 久 性 一 样 ， 普 通 程序 没 必 要 具备 隔离 性 。 例 如 ， 如 果 更 新 多 个 文件 的 程序 
并 发 执行 ， 更 新 可 能 交替 执行 ， 其 结果 可 能 与 顺序 执行 的 结果 完全 不 同 。 这 个 结果 可 能 完全 
不 能 接受 。 

ACID 性 质 区 别 事 务 与 普通 程序 的 特征 通常 缩写 为 ACID 性 质 [Haerder and Reuter 1983]. 

“原子 性 (Atomic) ”事务 要 么 被 完全 执行 ， 要 么 根本 没有 执行 。 

e 一致 性 (Consistent) 事务 维护 数据 库 的 一 致 性 。 

-WERTE (Isolated) ”事务 集合 的 并 发 执行 与 某 个 顺序 执行 的 效果 一 样 。 

“持久 性 (Durable) 事务 提交 后 的 效果 永久 记录 在 数据 库 中 。 

当 一 个 事务 处 理 系统 支持 ACID 性 质 的 时 候 ， 数 据 库 就 能 维持 一 个 一 致 的 、 当 前 最 新 的 现 


O 在 关系 数据 库 中 ，r 和 w 代 表 SELECT 和 和 UPDATE 语句 。 
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实 世 界 的 模型 ， 并 且 事 务 一 直 能 给 用 户 提 供 正确 的 和 最 新 的 响应 。 


2.4 参考 书目 


{Codd1970,1990] 提 出 了 数据 库 关系 模型 。SQL-92 标 准 [SQL1992] 解 释 了 SQL 语 言 。[Haerder and 
Reuter 1983] 提 出 了 术语 ACID ， 但 是 ACID 的 个 别 部 分 在 更 早期 的 论文 中 有 所 提 及 ， 例 如 ，[Gray et al. 
1976] 和 [Eswaran et al. 1976] 。 


2.5 练习 


2.1 给 定 关系 MARRIED、 关 系 BROTHER 和 关系 SIBLING。 关 系 MARRIED 由 形 为 (a，b) 的 元 组 组 成 ， 其 中 a 
BKK, ABT; 关系 BROTHER 由 形 为 (c，d) 的 元 组 组 成 ， 其 中 c 是 d 的 兄弟 ; 关系 SIBLING 由 形 
A” (e, f) 的 元 组 组 成 ， 其 中 e 和 f 互 为 兄弟 姐妹 。 请 描述 你 怎样 定义 关系 BROTHERINLAw， 其 元 组 的 
形式 为 (x，y)，x 是 y 的 姊妹 的 丈夫 。 
2.2 设计 下 面 的 两 张 表 (除了 图 2-1 之 外 )， 它 们 可 能 在 学 生 注 册 系 统 中 使 用 。 注 意 ， 同 样 的 学 生 Id 可 能 
在 每 张 表 的 多 行 中 出 现 。 
a. 一 张 表 实现 关系 COURSESREGISTEREDFOR ， 该 关系 联系 学 生 I4 和 他 已 经 注册 过 的 课程 的 数量 ; 
b. 一 张 表 实 现 关 系 COURSESTAKEN ， 该 关系 联系 学 生 Id、 他 已 经 完成 的 课程 和 每 门 课 的 成 绩 。 
指出 各 个 表 对 应 的 谓词 。 
2.3 写 出 下 述 的 SQL 语句 : 
a. 返回 STUDENT 表 中 所 有 大 学 四 年 级 学 生 (senior) 的 Id。 
b. 从 STUDENT 表 中 删除 所 有 大 学 四 年 级 的 学 生 。 i 
c. 把 STUDENT 中 的 所 有 大 学 三 年 级 学 生 (junior) 晋级 为 四 年 级 。 
2.4 写 出 创建 TRANSCRIPT 表 的 SQL 语句 。 
2.5 使 用 TRANSCRIPT 表 ， 写 出 下 述 的 SQL 语句 : 
a. 撤销 Id=123456789 的 学 生 对 2001 年 秋季 CS305 课 程 的 注册 。 
b. 将 Id=123456789 的 学 生 的 2000 年 秋季 CS305 课 程 的 成 绩 改 为 A。 
c. 返回 2000 年 秋季 注册 CS305 课 程 的 所 有 学 生 的 Id。 
2.6 写 出 SQL 语句 ， 返 回 在 2000 年 秋季 CS305 课 程 成 绩 A 的 所 有 学 生 的 姓名 (不 是 学 生 Id ) 。 
2.7 对 于 一 个 银行 应 用 来 说 ， 下 面 的 语句 是 不 是 检查 账户 数据 的 完整 性 约束 ? 请 说 明 你 的 理由 。 
a. 账户 的 balance 列 的 值 大 于 或 等 于 $ 0。 
b. 账户 的 balance 列 的 值 大 于 上 周 这 个 时 候 的 值 。 
c. 账户 的 balance 列 的 值 是 $ 128.32。 
d. 账户 的 balance 列 的 值 是 一 个 带 两 个 小 数位 的 小 数 。 
e. ik 户 的 social_security_number 列 非 空 ， 并 且 包 含 一 个 九 位 数 。 
f. 账户 的 check_credit_in_use 列 的 值 小 于 或 等 于 total_approved_check_credit 列 的 值 。( 这些 列 的 意 
义 很 明显 ， 就 不 再 加 以 解释 了 。) 
2.8 除 本 书 给 出 的 例子 外 ， 再 给 学 生 注 册 系 统 的 数据 库 列 出 五 个 完整 性 约束 。 


-29 给 出 一 个 学 生 注册 系统 的 例子 ， 它 的 数据 库 满足 完整 性 约束 IC0 ~ IC3， 但 是 它 的 状态 没有 反映 现实 。 





2.10 给 出 航班 预定 系统 的 数据 库 的 五 个 (可 能 的 ) 完整 性 约束 。 
2.11 航班 预定 系统 中 的 预定 事务 用 于 预定 航班 ， 在 飞机 上 预 留 一 个 座位 ， 打 印 一 张 机 票 ， 然 后 从 信用 
卡 账 户 中 扣 钱 。 假 设 预定 数据 库 的 某 个 完整 性 约束 是 : 每 个 航班 的 预定 人 数 不 能 超过 飞机 的 座位 





2.12 


2.13 


- 2.14 
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数 。 请 说 明 该 系统 的 事务 可 能 违反 下 列 性 质 的 例子 : 

a. 原子 性 

b. 一 致 性 

c. 隔离 性 

d. 持久 性 

请 描述 下 面 事件 的 哪些 方面 符合 或 违反 事务 的 原子 性 和 持久 性 。 

a. 利用 投 币 式 公用 电话 打出 一 个 电话 。( 考虑 电话 线路 忙 ， 宙 有 回音 ， 以 及 电话 号 码 错 误 的 情况 。 
什么 时 候 事务 提交 ? ) 

b. 一 个 结婚 典礼 。( 假 设 牧师 没有 出 现 。 假 设 新 郎 拒 绝 说 “我 愿意 .。” 什 么 时 候 事务 提交 ? ) 

c. 购买 一 座 房子 。( 假 设 在 签订 购买 协议 之 后 ， 业 主 没 能 申请 到 贷款 。 假 设 业主 最 后 取消 协议 。 假 
设 两 年 之 后 业主 没有 能 力 支付 货款， 银行 将 房子 收回 。) 

d. 一 场 人 垒球 比赛 。( 假 设 是 雨天 。) l 

每 个 学 生 修 完 课程 后 都 会 得 到 该 课程 的 成 绩 。 假 设 系统 除了 存储 成 绩 外 ， 还 保存 每 个 学 生 积累 的 

学 分 (GPA )。 请 描述 与 这 些 信息 有 关 的 一 个 完整 性 约束 。 如 果 记 录 新 成 绩 的 事务 不 是 原子 性 的 ， 

请 描述 该 事务 将 怎样 违反 约束 。 

在 上 一 个 习题 中 ， 如 果 两 个 事务 同时 记录 某 一 个 学 生 的 不同 课程 的 ) 成 绩 ， 请 解释 将 如 何 发 生 

更 新 丢失 。 





第 3 章 案例 研究 : 开发 学 生 注册 系统 


3.1 软件 工程 方法 学 


学 生 注 册 系 统 的 实现 需要 按 计划 进行 。 由 教师 、 学 生 和 注册 人 员 代表 组 成 的 团队 已 经 开 
过 几 次 会 ， 并 将 第 2 章 中 所 给 出 的 非 正式 的 目标 陈述 修正 为 正式 的 需求 文档 (在 3.2 节 中 再 介 
绍 )。 现 在 可 以 开始 注册 系统 项 目的 工作 了 。 

事务 处 理 系 统 的 实现 是 一 项 非常 费力 的 工程 。 项 目 必须 按时 完成 ， 不 能 超出 预算 ; 并 且 
在 运行 的 时 候 ， 系 统 必 须要 和 需求 相 吻 合 ， 要 既 可 靠 双 有效。 项 目的 文档 和 编码 必须 在 很 长 
一 段 时 间 内 可 以 维护 并 且 可 以 扩展 。 最 重要 的 是 ， 系 统 必须 满足 用 户 的 需求 。 

在 许多 成 功 与 失败 的 软件 项 目的 基础 上 ,许多 过 程 和 方法 已 经 演化 为 大 家 公认 为 的 执行 
这 种 项 目的 “好 的 工程 实践 ”。 许 多 书 和 课程 都 是 关于 软件 工程 的 。 这 里 ， 我 们 描述 一 种 方法 
并 将 之 应 用 到 学 生 注册 系统 的 开发 中 去 。 

项 目 一 般 开 始 于 在 第 2 章 给 出 的 非 正式 的 目标 陈述 。 对 系统 的 顾客 和 用 户 来 说 ， 下 一 步 可 
能 在 系统 分 析 员 的 协助 下 ， 将 这 些 目 标 扩展 为 正式 的 需求 文档 (requirements document)。 需 
求 文档 详细 描述 系统 应 该 做 什么 ， 而 不 是 如 何 去 做 。 在 许多 环境 里 ， 需 求 文档 是 对 实现 者 的 
请 求 建议 书 (RFP)， 它 描述 顾客 希望 实现 者 建立 的 系统 。 

规格 说 明文 档 (specification document) ”实现 团队 详细 分 析 需 求 文档 ， 然 后 写 出 规格 说 
明文 档 。 规 格 说 明文 档 是 需求 文档 的 扩展 版 本 ， 更 详细 地 描述 系统 应 该 做 什么 。 在 许多 情况 
下 ， 规 格 说 明文 档 是 一 个 合同 蓝本 ， 精 确 地 描述 实现 团队 应 该 去 建立 的 系统 。 规 格 说 明文 档 
的 描述 非常 精确 ， 以 至 于 可 以 同时 编写 和 发 布 用 户 手册 和 规格 说 明文 档 。 下 面 的 例子 展示 需 
求 文档 和 规格 说 明文 档 之 间 在 细节 方面 的 差异 。 

“ 在 需求 文档 中 ， 列 出 用 户 的 交互 需求 ， 同 时 给 出 每 个 交互 打算 做 什么 。 在 规格 说 明文 档 

中 ， 指 定 与 每 个 交互 相关 的 表单 。 比 如 ， 每 当 某 个 按钮 按 下 时 ， 以 及 某 个 菜单 项 被 访问 

时 ， 会 发 生 什么 情况 。 

。 需 求 文档 中 列 出 系统 必须 提供 的 信息 。 规 格 说 明文 档 则 包含 所 有 信息 项 的 域 。 

注意 ， 我 们 在 需求 文档 和 规格 说 明文 档 中 ， 讨 论 的 是 交互 而 不 是 事务 。 交 互 是 一 种 模糊 
的 术语 ， 它 表明 用 户 想 去 执行 的 功能 ( 例如， 注册 课程 、 评 学 分 )。 在 需求 分 析 阶 段 ， 我 们 还 
不 知道 会 有 多 少 事务 将 用 于 实现 交互 一 一 那 是 设计 的 一 部 分 。 

当 顾 客 签署 规格 说 明文 档 后 ， 就 可 以 开始 项 目的 设计 。 规 格 说 明文 档 描述 系统 应 该 做 什 
么 ， 而 设计 主要 描述 如 何 实现 系统 的 功能 。 我 们 会 在 第 12 章 讨论 设计 问题 。 涉 及 数据 库 设计 
的 内 容 在 第 5 章 和 第 8 章 讨论 。 在 5.7 节 我 们 会 给 出 完整 的 学 生 注 册 系 统 的 数据 库 设 计 ， 在 12.6 
节 给 出 注册 事务 的 完整 设计 和 部 分 代码 。 

在 产生 需求 文档 和 规格 说 明文 档 上 花费 如 此 多 的 时 间 和 精力 的 一 个 原因 是 : 有 经 验 表明 
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建立 一 个 使 顾客 满意 的 系统 相当 难 。 一 般 来 说 ， 系 统 需 求 非常 复杂 ， 顾 客 描述 出 的 需求 很 难 
达到 编程 所 需要 的 精确 度 ， 或 者 顾客 遗漏 了 重要 的 细节 (例如 ， 在 大 量 的 学 生 已 经 注册 某 一 
课程 后 ， 如 果 该 课程 将 被 取消 ， 应 该 怎么 办 ) ， 又 或 者 指定 一 些 特征 ， 而 在 系统 实现 这 些 特征 
后 ， 用 户 又 不 满意 。 在 项 目 开始 的 时 候 就 应 该 与 顾客 协调 章 拟 并 精 化 规格 说 明文 档 ， 如 果 说 
明文 档 不 符合 用 户 的 需求 ， 而 不 得 不 在 项 目 将 近 结 束 的 时 候 改动 系统 ， 将 使 得 项 目 实现 成 本 
is EB ELAR | 

学 生 注册 系统 项 目的 下 一 步 “在 3.2 节 中 ， 我 们 将 给 出 顾客 提供 的 学 生 注册 系统 的 需求 文 
档 。 注 意 : 一 些 交互 可 能 只 有 教师 会 执行 (例如 ， 评 学 分 )， 而 其 他 的 一 些 交互 则 是 教师 和 学 
生 都 会 执行 的 〈 例 如 ， 打 印 成 绩 单 ) 。 区 别 就 在 于 授权 (authorization) 的 角色 一 一 只 有 经 过 
授权 的 人 才能 执行 某 些 活动 。 授 权 应 当 和 认证 (authentication) 区 别 开 来 ， 认 证 使 用 密码 来 
确认 用 户 。 

同时 要 注意 , 在 数据 库 中 有 两 类 信息 。 有些 信息 是 必需 的 (例如 , 每 个 学 生 的 Id 号 和 密码 )， 
而 有 些 信息 是 可 选 的 (这 些 信息 可 能 无 法 获得 ,或 者 在 输入 数据 的 时 候 还 不 知道 )。 例 如 ， 某 
门 课程 将 会 分 配 一 间 教室 ， 但 可 能 在 将 课程 输入 数据 库 的 时 全 还 不 知道 该 教室 的 房间 号 ， 

项 目的 下 一 阶段 是 分 析 需 求 文档 ， 产 生 正式 的 规格 说 明文 档 。3.4 节 ~ 3.7 节 将 会 设计 图 形 
用 户 界面 (规格 说 明文 档 的 必要 部 分 )。 我 们 在 3.8 节 将 继续 讨论 规格 说 明文 档 。 


3.2 需求 文档 


| 介绍 ` 


学 生 注册 系统 的 目标 是 使 学 生 和 相关 教师 完成 以 下 的 操作 
A. 对 系统 的 用 户 身份 进行 认证 。 
B. 注 册 下 一 学 期 的 课程 。 
C. 获 得 某 一 学 生 情况 的 报告 。 
D. 维护 学 生 和 课程 信息 。 
E. 输入 学 生 已 经 完成 的 课程 的 最 终 成 绩 。 
在 文档 中 ， 术 语 “ 参 与 ” 指 一 个 学 生 正在 学 习 的 课程 ,而 “注册 ” 指 学 生 下 学 期 可 以 先 
的 课程 
1 相关 文档 
A. 学 生 注册 系统 的 日 标 陈述 (包括 日 期 和 版 本 号 )， 
B. 大 学 本 科 生 公告 栏 (包括 日 期 )。 
川 系统 中 包括 的 信息 
A. 系统 应 该 包括 允许 使 用 该 系统 的 每 位 教师 和 学 生 的 姓名 、I、 密 码 和 身份 。 身 份 指 
O ”需求 要 进行 编号 ， 以 便 在 以 后 的 文档 〔 比 如 用 于 测试 系统 是 咨 满足 需求 的 测试 计划 ) 中 引用 。 而 且 ， 使 用 
诸如 “将 会 ”和 “必须 ”之 类 的 词 是 必要 的 。“ 应 当 ” 或 者 “能 ”之 类 的 词 并 不 意味 着 该 文档 是 一 个 有 效 


力 的 文档 ， 应 当 避 免 使 用 这 些 词 ， 除 非 需 求 是 可 选 的 。 例 如 ， 在 早期 的 记录 需求 文档 中 (即使 需求 已 经 被 
编号 ) 仍然 使 用 “Thou shall not kill” ,而 不 是 “Thou should not kill”. 





IV 


22 # ED # 论 


该 用 户 是 学 生还 是 教师 。 密 码 用 来 认证 用 户 并 且 决 定 该 用 户 以 什么 身份 登录 ， 而 Id 号 
是 唯一 的 。 在 初始 化 时 假设 至 少 有 一 个 教师 已 经 是 有 效用 户 。 
B. 系统 将 会 包括 每 位 学 生 的 学 科 记 录 。 
1. 学 生 修 完 的 每 门 课程 ， 学 生 学 习 某 门 课程 的 学 期 ， 学 生 所 取得 的 成 绩 (成 绩 可 能 是 
A. B, C, D, E, F, I). 
2. 本 学 期 学 生 参 与 的 每 门 课程 。 
3. 学 生 为 下 学 期 所 选 的 每 门 课程 。 
C. 系统 将 会 包括 所 提供 的 课程 的 信息 。 对 于 每 门 课程 ， 系 统 将 会 包括 如 下 信息 : 
1. 课程 名 、 课 程 号 (必须 唯一 )、 开 设 课 程 的 系 、 所 需 教材 、 课 时 。 
2. 课程 是 春季 开设 还 是 秋季 开设 ， 或 者 都 开设 。 
3. 预备 课程 (每 门 课程 有 可 能 有 一 些 必须 先行 学 习 的 课程 )。 
4. 允许 参与 的 最 多 人 数 、 即 选课 的 最 多 人 数 (如 果 该 课程 本 学 期 不 开设 ， 则 不 需要 指 
Z); 已 经 注册 的 学 生 人 数 (如 果 下 学 期 不 开设 该 课程 ， 可 以 不 指定 )。 
5. 如 果 一 门 课程 本 学 期 开课 ， 给 出 开课 的 日 期 和 时 间 ; 如 果 该 课程 下 学 期 开课 ， 要 给 
出 将 开课 的 日 期 和 时 间 。 可 能 的 取 值 应 该 从 一 些 国定 的 日 期 中 选取 (如 MWF10 )。 
6. 教授 该 课程 (不管 是 本 学 期 还 是 下 学 期 开 ) 的 教师 Id (如 果 指 定 的 学 期 不 开课 ， 则 
可 以 不 指定 ; 但 是 必须 在 开课 前 指定 好 )。 
7. 为 该 课程 (不 管 是 本 学 期 还 是 下 学 期 开 ) 分 配 的 教室 。( 如 果 指 定 的 学 期 不 开课 ， 
则 可 以 不 指定 ; 但 是 必须 在 开课 前 指 窗 好 )。 
所 有 信息 必须 和 本 科 生 公告 栏 内 所 公布 的 信息 一 致 。 
D. 系统 应 该 包括 已 开设 的 所 有 课程 的 记录 ， 该 记录 包含 课程 的 开设 学 期 和 教师 Id。 
E. 系统 应 该 包括 教室 编号 和 相应 的 座位 数 的 列表 。 教 室 编号 是 一 个 唯一 的 三 位 整数 。 
F. 系统 应 该 包括 当前 学 期 的 标志 (如 : F997, $1996). 
完整 性 约束 
在 第 亚 部 分 描述 的 数据 库 将 会 满足 下 面 的 完整 性 约束 : 
A. Id 唯一。 
B. 假如 在 3.2 节 中 的 项 严 B2 (M B3) 中 ， 列 出 已 参与 (或 者 注册 ) 某 一 课程 的 学 生 ， 则 
该 课程 必须 在 项 苹 C2 中 说 明 在 本 学 期 (下 学 期 ) 开设 。 
C. 在 3.2 节 的 项 三 C4 中 ， 参 与 或 者 注册 某 一 课程 的 学 生 人 数 不 能 大 于 允许 的 最 大 参与 
人 数 。 
D. 在 3.2 节 的 项 大 B2 (M B3) 中 提 及 的 参与 或 者 注册 该 课程 的 学 生 人 数 必须 和 项 于 C4 
中 当前 参与 或 者 注册 的 人 数 相 同 。 
E. 一 名 教师 不 能 在 同一 学 期 同一 时 间 被 安排 两 门 课程 。 
F. 两 门 课程 不 能 在 给 定 的 学 期 的 同一 时 间 安 排 在 同一 个 教室 开设 。 
G. 如 采 一 名 学 生 已 经 参与 某 一 课程 ， 则 该 学 生 必 须 已 经 完成 该 课程 规定 的 预备 课程 ， 而 
且 成 绩 不 能 低 于 C。 
H. 一 名 学 生 不 能 注册 在 同一 时 间 教 授 的 两 门 课程 。 
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I. 一 个 学 生 不 能 在 特定 的 学 期 里 注册 超过 20 个 学 分 的 课程 。 
J. 分 配给 某 一 课程 的 教室 的 座位 数 必须 大 于 等 于 该 门 课 程 允 许 的 最 大 登记 人 数 。 
K. 一 旦 成 绩 (A, B, C DRF) 已 经 被 给 定 ， 则 它 不 能 被 改变 到 Is 。 


V 与 系统 的 交互 

与 系统 的 交互 被 安排 为 会 话 。 当 一 个 用 户 执行 认证 交互 时 ， 开 启 一 个 会 话 ; 当 用 户 执行 

结束 会 话 交互 时 ， 会 话 结束 。 在 一 个 会 话 中 ， 用 户 执行 若干 交互 。 

A. 认 证 无论 什么 时 候 开启 一 个 会 话 ， 用 户 必须 被 认证 。 认 证 的 目的 是 验证 用 户 ， 并 确 
定 他 是 一 名 学 生还 是 教师 ， 会 话 中 随后 的 交互 取决 于 该 用 户 的 身份 。 在 交互 中 要 输入 
Id 和 密码 。 

B. 注册 ”这 个 交互 只 能 由 学 生 执行 。 目 的 是 让 学 生 注册 下 学 期 要 修 的 课程 。 输 入 是 课程 
代号 ,输出 包括 下 面 的 内 容 之 一 : 

1. 如 果 该 学 生 注 册 一 门 课程 成 功 ， 输 出 课程 号 。 
2. 学 生 不 能 注册 的 原因 。 

车 发 生 下 列 情况 (包含 在 输出 中 )， 则 注册 失败 : 

1. 学 生 没有 按照 要 求 在 该 课程 的 预备 课程 中 获得 C 以 上 的 成 绩 ， 或 者 现在 还 没有 完成 
预备 课程 。 

2. 该 课程 已 注册 的 学 生 数 超过 最 大 注册 数 。 

3. 交互 的 发 起 者 不 是 一 个 学 生 。 

4. 该 学 生 同 时 注册 了 另外 一 门 课程 。 

5. 该 同学 正在 参与 该 课程 或 者 该 同学 已 经 修 过 该 课程 ， 并 获得 C 以 上 的 成 绩 ， 

6. 该 课程 下 学 期 不 开设 。 

7. 该 学 生 已 经 注册 过 该 课程 。 

8. 如 果 该 门 课程 注册 成 功 ， 该 学 生 注 册 的 课程 的 学 分 数 将 超过 20。 

C. 注销 课程 ”交互 只 能 由 学 生 执 行 。 目 的 是 让 该 学 生 注销 已 经 在 早 些 时 候 注册 的 下 学 其 
将 开设 的 某 门 课程 。 输 入 是 课程 号 ， 如 果 该 学 生 没有 注册 过 该 课程 ， 则 注销 课程 将 失 
败 。 | 

D. 取得 成 绩 记 录 ”交互 的 目的 是 产生 一 个 报告 ,该 报告 描述 一 个 学 生 每 个 学 期 完成 的 课 
程 的 成 绩 。 访 交互 使 用 学 生 的 It， 如 果 该 学 生 正在 执行 交互 ， 则 该 学 生 不 再 需要 输入 
Id， 因 为 他 只 能 看 到 自己 的 成 绩 报告 ，Id 已 经 作为 认证 的 一 部 分 进行 了 验证 。 如 果 一 
个 教师 执行 该 交互 并 且 输 入 一 个 无 效 的 学 号 ， 则 交互 失败 。 报 告 将 包括 以 下 内 容 : 

1. 当前 的 学 期 。 

2. 学 生 名 字 和 Id。 

3. 按照 学 期 分 类 的 带 有 授课 教师 和 成 绩 的 课程 列表 。 

4. 学 期 的 GPA 和 每 个 学 期 该 学 生 已 经 完成 的 学 分 数 。 

5. 到 目前 为 止 该 学 生 完 成 的 所 有 课程 的 学 分 数 和 累积 的 GPA。 


日 、 这 是 一 个 动态 完整 性 约束 的 例子 ， 它 限制 对 于 数据 库 状 态 可 以 进行 的 修改 。 而 静态 完整 性 约束 限制 数据 库 
可 允许 的 状态 。 我 们 在 4.2.2 中 讨论 动态 完整 性 约束 。 
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E. 取得 注册 课程 ”交互 的 目的 是 产生 一 个 报告 ， 该 报告 列 出 某 个 学 生 下 学 期 注册 的 课程 。 
交互 时 输入 学 生 的 Id。 如 果 该 学 生 正在 执行 交互 ， 则 该 学 生 不 需要 输入 Id， 因 为 他 只 
能 看 到 自己 的 报告 ，Id 已 经 作为 认证 的 一 部 分 进行 了 验证 。 如 果 一 个 教师 执行 该 交互 
并 且 输 入 一 个 无 效 的 Id， 则 交互 失败 。 报 告 将 包括 以 下 内 容 : 

1. 学 生 姓 名 和 Id。 

2. 课程 号 和 学 时 。 

3. 每 门 课 程 的 时 间 安 排 。 

4. 分 配 的 教室 (如果 可 以 得 到 )。 
5. 教师 (如 果 可 以 得 到 )。 

F. 取得 参与 的 课程 ”交互 的 目的 是 产生 一 个 报告 ， 该 报告 列 出 某 个 学 生 本 学 期 参与 的 课 
程 。 交 互 时 输入 学 生 的 Id。 如 果 该 学 生 正 在 执行 交互 ， 则 该 学 生 不 需要 输入 Id， 因 为 他 
只 能 看 到 自己 的 报告 ，Id 已 经 作为 认证 的 一 部 分 进行 了 验证 。 如 果 一 个 教师 执行 该 交 
互 并 且 输入 一 个 无 效 的 Id， 则 交互 失败 。 报 告 将 包括 以 下 内 容 : 

1. 学 生 姓 名 和 Id。 

2. 课程 号 和 学 时 。 

3. 每 门 课程 的 时 间 安 排 。 

4. 分 配 的 教室 。 

5. 教师 。 . 

G 学 生成 绩 ”交互 的 目的 是 给 出 或 者 更 改 一 个 学 生 已 完成 的 课程 的 成 绩 。 交 互 只 可 以 由 
授课 教师 来 执行 。 输 入 为 It、 课程 号 、 学 期 和 成 绩 。 

1. 如 果 发 生 下 列 情况 ， 则 交互 失败 : 

.交互 不 是 由 本 学 期 指定 的 授课 教师 发 出 。 

b. 学 生 的 Id 无 效 。 
c. 该 学 生 当 前 设 有 参与 课程 ， 而 且 以 前 也 设 有 修 过 该 课程 。 
d. 交互 可 以 将 成 绩 (A. B, C, D) KAL 

2. 如 果 交 互 成 功 : : 
a. 学 生 不 再 作为 参与 该 课程 的 人 出 现 ， 只 作为 已 经 顺利 完成 该 课程 的 学 生出 现 。 
b. 如 果 该 课程 是 学 生 已 经 注册 的 下 学 期 的 某 门 课程 的 预备 课程 ， 而 且 此 学 生 的 成 

绩 低 于 C， 那 么 会 强行 让 该 学 生 注 销 掉 该 门 课程 。 

H. 学 生 、 教 师 信 息 ”交互 的 目的 是 增加 、 删 除 或 者 编辑 在 项 HI 的 A 中 指定 的 项 。 如 果 增 
加 项 ， 则 必须 包括 名 字 、Id 号 、 教 师 / 学 生 身 份 和 密码 。 如 果 删 除 或 者 编辑 项 ， 则 必须 
提供 Id 号 ， 以 及 要 修改 的 任何 字段 。 如 果 交 互 的 执行 者 不 是 教师 ， 则 交互 失败 。 

I. 课程 信息 ”交互 的 目的 是 显示 或 者 编辑 描述 已 经 存在 的 课程 (OC) 的 信息 ; 或 者 输 
入 新 的 课程 信息 。 交 互 输入 课程 号 ， 交 互 可 以 改变 课程 的 任何 信息 ， 但 是 不 能 删除 课 
程 。 学 生 只 能 浏览 课程 信息 ， 不 能 输入 或 编辑 课程 信息 。 如 果 编 辑 的 课程 信息 违反 任 


A 


何 完整 性 约束 ， 则 交互 失败 。 





昌 ”在 真实 系统 中 ,数据库 管理 员 会 使 用 一 个 特殊 的 事务 集 来 控制 这 些 信息 。 在 这 个 项 目 里 ， 为 简化 起 见 ， 我 
们 假设 ， 数 据 库 在 初始 化 时 就 至 少 带 有 一 个 教师 的 姓名 ，Id 和 密码 。 





VI 


vi 
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J. 学 期 结束 ”交互 的 目的 是 结束 该 学 期 。 该 交互 只 能 由 教师 执行 。 交 互 会 产生 下 列 的 

影响 : 

1. 在 项 了 的 FF 中 指定 的 当前 学 期 的 标志 将 会 向 前 进 1。 

2. 对 每 个 学 生来 说 ， 成 绩 I 将 被 分 配给 该 学 生 已 经 在 参与 但 还 没有 给 出 成 绩 的 课程 。 
3. 数据 库 中 将 会 把 以 前 标记 为 学 生 已 经 注册 的 课程 修改 为 已 经 参与 的 课程 。 

4. 对 列 在 项 三 的 C4 中 的 每 门 课程 , 参与 的 学 生 数 将 会 被 设 为 和 已 经 注册 的 学 生 数 相等 ， 
而 注册 的 学 生 数 将 被 设 为 0。 

当 某 个 下 学 期 要 开设 的 课程 尚未 被 指定 教师 或 是 教室 时 ， 该 交互 失败 。 

K. 得 到 课程 的 学 生花 名 册 ”交互 的 目的 是 产生 当前 参与 或 者 已 注册 某 一 门 课程 的 学 生 的 
Id 和 姓名 的 列表 。 交 互 只 能 由 教师 完成 。 交 互 输入 课程 号 以 及 一 个 指示 要 列 出 的 是 参 
与 还 是 注册 学 生 列表 的 标识 。 如 果 申 请 参与 某 门 课程 的 学 生 列表 ， 但 本 学 期 没有 开设 
该 课程 或 者 申请 注册 某 门 课程 的 学 生 列表 ， 但 下 学 期 不 开设 该 课程 ， 则 交互 失败 。 

L. 教室 ”交互 的 目的 是 显示 教室 (项 三 E) 的 座位 数 ， 或 者 输入 新 教室 号 和 座位 数 。 交 
互 时 输入 教室 号 和 座位 数 (如 果 是 新 教室 ) 或 者 仅仅 是 教室 号 (如 果 需 要 该 教室 的 座 
位 数 )。 交 互 只 可 以 由 教师 进行 。 

M.OLAP 查 询 ”交互 的 目的 是 允许 用 户 从 屏幕 输入 任意 的 查询 语句 。 交 互 仅 能 由 教师 
(假定 他 了 解数 据 库 的 模式 ) 执行 。 查 询 使 用 简单 的 SELECT 语句 的 形式 ， 查 询 结果 以 
第 一 行列 出 属性 名 ， 其 他 行列 出 结果 的 格式 显示 在 屏幕 上 。 如 果 输 入 的 不 是 SELECT 
语句 或 者 SELECT 语句 输入 不 正确 ， 则 交互 失败 。 

N. 结束 会 话 交互 的 目的 是 结束 会 话 。 接 下 来 的 与 该 系统 的 任何 交互 都 会 需要 重新 认证 。 


系统 问题 


A. 系统 会 作为 客户 /服务 器 (client/server) 系统 来 实现 。 客 户 端 计算 机 将 是 执行 应 用 程序 
的 个 人 电脑 。 

B. 应 用 程序 将 会 使 用 一 个 应 用 生成 器 来 实现 。 

C. 用 户 界 面 将 是 图 形 化 的 ， 很 容易 使 用 ， 学 生 和 教师 基本 上 不 需要 培训 即 可 使 用 。 

D. 数 据 库 可 以 是 任何 SQL 数据 库 。 该 数据 库 在 服务 器 上 执行 ， 并 且 提 供 事务 接口 ( 换 句 
话说 ， 它 可 以 执行 提交 和 异常 中 止 的 操作 )。 


交付 的 产品 列表 


A. 详细 描述 发 生 在 每 个 交互 中 的 事件 序列 的 规格 说 明文 档 ， 其 中 包括 : 
1. 使 用 的 表单 和 控件 。 
2. 每 个 表单 使 用 的 控件 的 效果 ， 包 括 作为 每 个 可 能 的 动作 的 结果 来 显示 的 任何 新 表单 。 
3. 系统 检查 的 错误 和 输出 的 错误 信息 。 
4. 完整 性 约束 。 
B. 详细 描述 的 设计 文档 。 
1. 描述 系统 的 实体 -联系 (entity-relationship) 图 。 
2. 所 有 数据 库 元 素 的 声明 ， 包 括 表 、 域 和 断言 。 
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3. 每 个 交互 分 解 成 的 事务 和 过 程 。 
4. 每 个 事务 和 过 程 的 行为 。 
C. 测试 计划 ， 它 描述 系统 如 何 被 测试 ， 包 括 如 何 测试 每 个 需求 和 规格 说 明 。 
D. 一 个 完整 系统 的 展示 (包括 运行 测试 计划 中 提 到 的 测试 )。 
E. 系统 的 完整 的 文档 化 的 代码 。 
F. 分 别 为 学 生 和 教师 设计 的 用 户 手册 。 
G. 描述 已 交付 的 系统 的 规格 说 明文 档 、 设 计 文档 和 测试 计划 的 第 二 个 版 本 。 


3.3 需求 分 析 一 一 新 问题 


经 验 表 明 ， 不 管 怎样 小 心地 编写 需求 文档 ， 当 实现 小 组 为 准备 规格 说 明文 档 而 分 析 需 求 
时 ， 总 有 一 大 堆 新 问题 会 涌现 出 来 。 我 们 会 发 现 部 分 需求 文档 不 一 致 或 不 完整 ， 有 关 某 些 没 
有 预见 的 情况 下 的 系统 行为 问题 等 就 会 出 现 。 实 现 团队 通常 向 顾客 说 明 这 些 问题 ， 顾 客 会 给 
出 一 个 书面 解决 文档 。 解 决 过 的 问题 成 为 新 版 本 的 需求 文档 的 一 部 分 ， 也 成 为 初始 版 本 的 规 
格 说 明文 档 的 一 部 分 。 这 表明 要 精确 指定 系统 的 期 望 行为 是 非常 困难 的 。 

当 将 上 一 节 给 出 的 需求 文档 交 给 本 地 的 实现 团队 进行 分 析 的 时 候 ， 就 会 指出 大 量 的 问题 。 
接 下 来 ， 我 们 列 出 其 中 一 些 问 题 ， 以 及 一 些 解决 方案 。 可 能 你 们 本 地 的 实现 团队 也 会 发 现 其 
他 问题 。 

问题 1 ”在 课程 信息 交互 时 ， 如 果 为 一 门 课程 添加 预备 课程 ， 但 是 发 生 循环 ， 该 怎么 办 ? 
例如 ， 课 程 A 是 课程 B 的 预备 课程 ，B 是 课程 C 的 预备 课程 ， 而 C 是 A 的 预备 课程 。 换 名 话说， 
课程 A 是 它 自己 的 预备 课程 。 

解决 方案 必须 在 数据 库 中 加 入 新 的 完整 性 约束 来 处 理 这 种 情况 ， 即 预备 课程 必须 不 存在 
循环 。 任 何 实现 课程 信息 交互 的 事务 都 要 检查 这 个 条 件 。 如 果 存 在 循环 ， 则 不 能 添加 预备 课 
fe, 并且 将 相关 信息 显示 给 用 户 。( 一 般 情况 下 ,循环 检查 并 不 简单 。 然 而 ， 我 们 可 以 要 求 一 
门 课程 的 预备 课程 的 编号 小 于 它 自己 的 编号 。 这 样 的 要 求 可 以 避免 产生 循环 。) 

问题 2 ”在 课程 信息 交互 时 ， 如 果 为 一 门 课程 添加 预备 课程 ， 但 是 有 一 个 学 生 已 经 注册 该 
课程 却 还 没 修 过 预备 课程 ， 该 怎么 办 ? 

解决 方案 不 为 下 一 个 学 期 的 课程 添加 新 的 预备 课程 。 

问题 3 ”在 课程 信息 交互 时 ， 如 果 把 一 门 课程 允许 的 最 大 学 生 人 数 减少 到 某 一 个 值 ， 但 是 
这 个 值 小 于 现在 已 经 注册 的 学 生 数 ， 该 怎么 办 ? 

解决 方案 重新 分 配 教室 在 现实 的 学 校 中 很 常见 ， 所 以 必须 允许 进行 这 种 操作 。 然 而 ， 必 
须 撤销 适当 数量 的 学 生 对 课程 的 注册 ， 使 得 已 注册 学 生 数 减少 到 新 的 最 大 值 。 撤 销 学 生 注 册 
的 顺序 应 该 与 注册 时 的 顺序 相反 。 所 有 已 撤销 注册 的 学 生 会 收 到 一 份 书面 通知 。 

问题 4 在 课程 信息 交互 时 ， 如 果 要 修改 一 门 课程 的 日 期 或 时 间 ， 该 怎么 办 ? 

解决 方案 不 对 下 一 个 学 期 课程 的 日 期 或 时 间 进 行 修改 。 

问题 5 在 课程 信息 交互 时 ， 如 果 要 取消 一 门 课程 ， 该 怎么 办 ? 

解决 方案 可 以 取消 下 一 个 学 期 的 课程 。 对 于 在 下 一 学 期 中 已 经 注册 该 门 课程 的 学 生 ， 可 

以 撤销 注册 ， 学 生 会 收 到 一 份 书面 通知 。 
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问题 6 在 学 生 /教师 信息 交互 时 ， 如 果 修 改 学 生 的 Id 号 ， 该 怎么 办 ? 

解决 方案 一 个 Id 号 (相对 于 姓名 或 密码 ) 永久 代表 一 个 人 ， 所 以 企图 改变 Id 号 没有 意义 ， 
除非 如 果 原 本 输入 的 14 号 是 错误 的 。 所 以 ， 只 有 学 生 在 系统 中 没有 其 他 相关 信息 ， 才 允许 改 
变 该 学 生 的 Id 号 。 

问题 7 茶 些 交互 ， 比 如 取得 成 绩 记 录 、 取 得 注册 课程 和 取得 参与 的 课程 ， 会 产生 一 些 描 
述 在 某 一 时 刻 的 数据 库 状 态 的 报告 。 这 些 报告 是 否 包括 产生 日 期 和 产生 时 间 的 信 电 ? 

解决 方案 是 的 ， 所 有 这 样 的 报告 必须 包括 日 期 和 时 间 信 息 。 

问题 8 项 II D 和 IIIF 的 信息 能 否 同时 包含 年 份 和 学 期 信息 ? 

解决 方案 是 的 ， 并且 在 学 期 结束 交互 时 需要 适当 地 更 新 年 份 。 这 个 信息 会 在 开始 的 时 候 
初始 化 。 

问题 9 系统 中 用 几 位 数 存储 年 份 信息 ? A 

解决 方案 四 位 。 


3.4 应 用 程序 生成 器 


学 生 注 册 系 统 需 要 复杂 的 用 户 界面 ， 规 格 说 明文 档 中 必须 详细 说 明 用 户 界面 的 内 容 。 用 
户 界面 必须 包含 表单 、 命 令 按钮 、 菜 单 、 文 本 框 等 等 。 描 述 和 编写 这 样 的 界面 看 起 来 是 很 艰 
难 的 任务 。 幸 运 的 是 ， 有 很 多 应 用 程序 生成 器 可 以 减少 需要 掌握 的 大 量 的 编程 知识 和 工作 量 。 
在 本 节 ， 我 们 讨论 这 些 应 用 程序 生成 器 的 基本 概念 。 

应 用 程序 生成 器 通常 包含 下 面 的 组 件 。 

。 图 形 用 户 界面 (GUI) 设计 器 ”程序 员 可 是 使 用 它 来 设计 GUI。 其 中 包括 用 户 交互 的 元 

素 : 表单 、 命 令 按 钮 、 菜 单 等 等 。 

。 编程 语言 可 用 于 编写 应 用 程序 ， 访 问 数据 库 和 执行 事务 。 

。 集 成 程序 开发 环境 ”包括 一 个 程序 编辑 器 和 其 他 帮助 程序 员 编写 程序 和 事务 以 及 链接 到 

GUI 的 工具 。 

。 允许 生 成 的 程序 连接 和 访问 一 个 或 多 个 DBMS 的 一 种 机 制 。DBMS 可 以 位 于 本 地 计算 机 ， 

也 可 以 位 于 网 络 的 其 他 计算 机 中 。 
一 些 数据 库 的 应 用 生成 器 也 包含 从 某 些 图 形 化 或 表格 符号 自动 生成 SQL 语句 的 功能 。 然 
而 ， 我 们 只 关心 GUI 怎样 产生 ， 以 及 它们 如 何 与 应 用 程序 交互 。 我 们 不 讨论 任何 某 个 应 用 程 
序 生成 器 ， 但 是 使 用 与 许多 商业 系统 相似 的 符号 。 我 们 应 区 别 应 用 程序 设计 者 和 应 用 程序 
的 用 户 。( 在 本 节 ， 我 们 使 用 术语 设计 者 特 指 程序 员 ， 他 们 使 用 应 用 程序 生成 器 来 设计 用 户 
界面 。) 


3.5 图 形 用 户 界 面 和 对 象 


事务 处 理 系统 的 GUI 包括 一 组 表单 form)。 例 如 ， 图 3-1 中 所 示 的 表单 ， 可 用 于 认证 学 生 
注册 系统 的 用 户 。 系 统 用 一 个 对 象 (object) 来 代表 每 个 表单 。( 我 们 将 在 附录 A 中 简要 地 讨 
a ) 例如 ， 对 应 于 某 个 表单 的 对 象 可 能 有 一 个 方法 Show ， 该 方法 使 该 表单 显示 在 屏幕 

。 每 个 表单 包含 一 组 控件 (control) ， 比 如 
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* 在 屏幕 上 显示 文本 的 标签 (label)。 例 如 ， 图 中 的 标题 。 

。 用 户 可 以 输入 信息 的 文本 框 (textbox )， 这 些 信息 可 作为 应 用 程序 的 输入 ， 应 用 程序 也 
可 以 在 文本 框 中 写 人 信息 作为 输出 。 例如， 在 图 3-1 中 ， 用 户 Id 和 密码 可 以 通过 文本 杠 
输入 。 

“用 户 可 以 用 鼠标 点 击 命令 按钮 (command button) ， 使 系统 完成 一 些 操作 。 例 如 ， 在 图 
3-1] 中 ， 当 “OK ”按钮 被 按 下 时 ， 系 统 读 取 文 本 框 中 的 信息 来 认证 用 户 。 

"菜单 、 单 选 框 (checkbox )、 复 选 框 (optionbox)， 用 户 可 以 通过 鼠标 点 击 从 中 选择 。 








7 5 


Welcome to the Student Registration Syste 


Please enter your login Id and password 


4 























图 3-1 学 生 注册 系统 的 初始 表单 


控件 在 系统 中 也 用 对 象 表示 。 例 如 , 一 个 菜单 可 能 有 一 个 方法 display_menu, 点 击 菜单 时 ， 
就 执行 该 方法 ， 从 而 显示 下 拉 菜 单 。 

为 设计 用 户 界面 ， 设 计 者 进入 GUI 设计 器 ， 通 过 鼠标 点 击 告诉 设计 器 在 屏幕 上 创建 一 个 空 
白 表 单 。 然 后 ， 设 计 者 可 以 从 一 个 菜单 中 选择 一 组 控件 ， 通 过 鼠标 点 击 把 它们 放置 到 表单 中 ， 
接着 使 用 一 般 的 拖 搜 操作 重 新 整理 控件 。GUI 设 计 器 可 能 显示 一 张 文 本 框图 ， 设 计 者 可 以 找 
贝 图 然后 把 图 拖 到 表单 中 适当 的 位 置 。. 

这 些 控件 和 表单 用 对 象 表示 ， 而 对 象 在 屏幕 上 有 对 应 的 可 视 化 表示 。 这 样 ， 我 们 把 这 些 
对 象 称 作 可 视 化 对 象 《visual object)， 我 们 可 以 把 将 可 视 化 对 象 视 为 由 下 列 两 个 数据 结构 包 
装 而 成 。 

1) 表示 对 象 语义 的 数据 结构 。 对 于 文本 框 对 象 来 说 ， 这 种 数据 结构 可 能 包括 两 个 字符 
串 : Name 和 Text。Name 的 值 是 文本 框 的 名 称 (每 个 可 视 化 对 象 必须 有 一 个 唯一 的 名 称 ， 应 
用 程序 使 用 它 来 指定 对 象 ) ，Text 的 值 是 文本 框 中 存储 的 文本 信息 (也 是 文本 框 在 屏幕 上 显 
示 的 信息 )。 : | 

2) 包含 对 象 的 可 视 化 表示 信息 的 数据 结构 。 一 个 命令 按钮 对 象 可 能 有 一 个 标签 ， 该 标签 
就 是 打印 在 命令 按钮 上 的 文本 。 另 外 可 能 还 包含 位 置 、 颜 色 、 字 体 、 字 体 大 小 等 等 的 信息 ， 
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它们 存储 在 名 为 Location、Color、Font、Typesize 等 变量 中 。 

作为 一 个 整体 ， 两 个 数据 结构 中 的 信息 被 认为 是 对 象 的 性 质 (property ) 或 属性 
(attribute)。 在 设计 过 程 中 ， 应 用 程序 设计 者 可 以 使 用 GUI 设计 器 显示 任何 对 象 的 属性 ， 可 以 
像 图 3-2 中 的 表 那 样 显示 文本 框 对 象 的 一 些 属性 。 

当 对 象 开 始 被 创建 的 时 候 ， 可 以 给 它 的 一 些 属性 (比如 文本 框 的 名 称 (Name) ) 赋予 默认 
值 (例如 ，Textbox1 )。 要 改变 名 称 ， 设 计 者 只 需 在 属性 表 的 “Name” 项 中 键入 想 要 的 名 称 
即 可 。 设 计 者 可 以 以 相似 的 方式 通过 修改 属性 来 定制 每 个 表单 中 的 每 个 对 象 。 我 们 将 会 看 到 ， 
属性 也 可 以 在 应 用 程序 运行 的 时 候 改变 。 


Objecttype Textbox 
Name Textbox1 
Text 

Domain 

Font 

X-Location 

Y-Location 

Height 

Width 

Color 


Typesize 











图 3-2 文本 框 对 象 的 一 些 属性 


文本 框 对 象 的 某 个 属性 可 能 是 信息 的 域 (domain) 一 一 在 运行 的 时 候 可 以 允许 键入 文本 
框 的 值 。 例 如 ， 一 个 文本 框 存储 一 个 社会 保障 号 码 ， 它 的 域 是 一 个 九 位 的 字符 串 数 值 ; 另 一 
个 文本 框 存储 用 户 的 性 别 ， 它 的 域 是 字符 M 或 FE。 当 用 户 键入 信息 的 时 候 ， 系 统 自 动 检查 键入 
的 值 是 否 在 域 所 人 允许 的 范围 内 ， 否 则 会 产生 一 个 错误 信息 。 

一 个 可 视 化 对 象 的 数据 结构 除 包含 它 的 属性 之 外 ， 还 会 封装 一 组 方法 ， 这 些 方 法 使 用 数 
据 结构 内 的 信息 在 屏幕 上 画 出 对 象 的 图 形 化 表示 。 我 们 可 以 称 之 为 制图 引 芗 (drawing engine). 
方法 Show 就 是 一 个 例子 。 制 图 引擎 的 方法 是 在 对 象 显示 的 时 候 自 动 调用 的 。 

制图 引擎 的 一 个 重要 任务 是 保持 图 形 表示 与 对 象 的 数据 结构 表示 的 一 致 性 。 例 如 ， 如 果 
设计 者 使 用 图 3-2 中 的 表 把 color 属 性 从 “red” 改 为 “green”， 制 图 引擎 的 一 个 方法 就 被 (自动 ) 
调用 ， 把 屏幕 上 对 象 的 颜色 从 红色 改 为 绿色 。 相 似 地 ， 如 果 设 计 者 使 用 鼠标 把 表单 中 的 文本 
框 从 一 个 位 置 拖 到 另 一 个 位 置 ， 制 图 引擎 方法 不 但 移动 对 象 ， 还 改变 对 象 的 数据 结构 表示 中 
Location 属 性 的 值 。 

这 样 ， 设 计 者 可 以 轻松 地 创建 和 定制 某 个 应 用 的 一 组 表单 。 其 中 一 个 原因 是 操纵 对 象 
(包括 它们 的 图 形 化 表示 ) 的 方法 相当 简单 。 应 用 程序 生成 器 已 经 提供 这 些 方法 ， 并 且 封 装 在 
对 象 模块 中 。 设 计 者 只 需 改变 对 象 的 属性 即 可 。 

大 多 数 应 用 程序 生成 器 提供 一 个 大 型 的 可 视 化 对 象 类 库 。 设 计 者 可 以 在 表单 中 对 其 进行 
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各 种 各 样 的 组 合 ， 但 只 需 做 少量 的 编程 工作 。 此 外 ， 大 多 数 的 应 用 程序 生成 器 允许 设计 者 定 
义 这 些 类 的 子 类 或 编辑 它们 的 代码 来 扩展 它们 的 属性 ， 这 样 ， 应 用 程序 生成 器 能 在 增加 复杂 
度 的 情况 下 提供 更 多 的 方便 。 

不 使 用 应 用 程序 生成 器 来 创建 GUI 

很 多 语言 (例如 Java) 包含 一 个 可 视 化 对 象 库 (以 及 合适 的 制图 引擎 )。 在 没有 应 用 程序 
生成 器 的 情况 下 ， 我 们 可 以 利用 这 些 对 象 库 通 过 传统 的 编程 技术 来 创建 GUI。 例 如 ， 使 用 Java 
抽象 窗口 工具 包 (Java Abstract Window Toolkit，AWT)， 一 个 程序 可 以 创建 一 个 按钮 对 象 的 
新 实例 ， 明 确 地 设置 它 的 属性 ， 然 后 把 它 放 在 一 个 窗口 中 一 一 所 有 操作 都 通过 库 的 方法 调用 
来 实现 。 因 为 库 中 的 图 形 化 对 象 包含 合适 的 制图 引擎 ， 所 以 设计 者 不 必 关 心 绘 制 对 象 的 真实 
细节 。 使 用 这 样 的 一 个 库 ， 设 计 者 可 以 很 轻松 地 编写 创建 GUI 的 程序 ， 这 比 使 用 应 用 程序 生 
成 器 更 加 简单 。 

为 使 GUI 响应 用 户 的 输入 , 程序 使 用 语言 的 事件 控制 机 制 。 当 应 用 程序 生成 器 生成 GUI 时 ， 
也 使 用 这 种 机 制 。 这 就 是 下 一 节 的 主题 。 


3.6 事件 和 过 程 


尽管 只 有 少数 的 程序 需要 在 屏幕 上 画 控 件 ， 但 是 设计 者 必须 编写 过 程 来 实现 某 一 应 用 的 
功能 。 这 些 由 应 用 程序 生成 器 提供 的 语言 所 写 的 过 程 组 成 了 应 用 程序 。 一 个 应 用 程序 的 过 程 
可 以 完成 如 下 工作 : 

。 在 应 用 程序 开始 的 时 候 显示 一 个 表单 。 

。 收 集 和 验证 由 表单 输入 的 信息 。 

。 改 变 表单 中 一 个 对 象 的 一 些 属性 (例如 ， 在 屏幕 上 对 象 的 外 观 )。 

。 执 行 与 应 用 相关 的 计算 ， 并 且 初 始 化 有 关 事务 去 访问 数据 库 (包括 执行 SQL 语 句 )。 

。 在 有 关 表 单 中 显示 从 事务 输出 的 信息 。 

。 产 生 有 关 打印 报告 。 

。 控 制 与 现实 应 用 交互 的 设备 。 

其 中 许多 功能 的 实现 涉及 到 表单 和 控件 的 方法 调用 。 

应 用 程序 过 程 是 事件 驱动 (event driven) 的 。 一 个 事件 (event) 是 一 个 经 常 (但 不 总 是 ) 
由 用 户 在 运行 时 发 起 的 动作 。 每 个 控件 都 有 一 组 相关 的 响应 事件 。 例 如 ， 当 用 户 使 用 鼠标 点 
击 一 个 命令 按钮 的 时 候 ， 按 钮 就 会 对 点 击 事件 有 响应 。 而 一 个 标签 控件 (比如 图 3-1 的 标题 ) 
对 点 击 事件 没有 响应 。 设 计 者 可 以 使 一 个 应 用 程序 过 程 与 某 个 对 象 的 每 个 事件 关联 。 应 用 程 
FERS (或 者 为 应 用 程序 过 程 使 用 的 语言 的 实现 ) 提供 一 种 机 制 : 在 运行 时 ， 它 能 识别 事 
件 发 生 的 时 间 和 与 事件 相关 联 的 对 象 ， 然 后 调用 相关 的 过 程 。 我 们 称 之 为 事件 触发 (tigger) 
过 程 调用 。 用 这 种 方法 ， 设 计 者 可 以 使 一 个 过 程 与 事件 “图 3-1 所 示 表 单 的 “OK ”按钮 被 点 
击 ”关联 。 这 样 ， 在 运行 时 按钮 一 旦 被 点 击 ， 过 程 就 会 自动 被 调用 。 

事件 有 名 称 ， 例 如 点 击 事件 的 名 称 为 “Ciick”。 通 过 过 程 的 名 称 可 以 将 过 程 与 事件 关联 起 
来 , 一 旦 事件 发 生 ， 过 程 就 被 执行 。 这 样 ， 应 用 程序 生成 器 可 能 要 求 在 “OK” 按 钮 被 点 击 时 
调用 的 应 用 程序 过 程 名 为 okbutton.Click， 其 中 okbutton 是 按钮 的 唯一 的 (内 部 ) 名 称 (应 该 
与 它 打印 在 屏幕 上 的 外 部 标签 “OK” 区 分 清楚 ) 一 一 也 就 是 它 的 Name 属 性 的 值 。 
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设计 者 必须 实现 应 用 程序 过 程 ， 这 样 才能 执行 事件 所 要 求 的 过 程 。 在 图 3-1 的 表单 中 ， 
okbutton.Click 过 程 可 能 完成 以 下 功能 : 

。 使 用 文本 框 中 输入 的 Id 和 密码 来 执行 认证 事务 。 

。 显 示 新 表单 ， 而 表单 的 显示 依赖 于 认证 事务 执行 成 功 还 是 失败 。 

设计 者 也 可 以 使 应 用 程序 过 程 与 某 个 不 是 由 用 户 直接 发 起 的 事件 关联 。 例 如 ， 当 应 用 程 
序 启 动 某 一 段 时 间 后 ， 或 当 系统 发 生 错误 的 时 候 ， 可 能 发 生 某 个 事件 。 

下 一 个 问题 是 应 用 程序 过 程 如 何 访问 表单 中 的 信息 或 改变 对 象 的 属性 。 正 如 我 们 看 到 的 ， 
许多 对 象 的 属性 可 以 由 应 用 程序 生成 器 提供 并 且 封 装 在 对 象 模块 中 的 方法 操纵 。 例 如 ， 在 设 
计 的 时 候 ， 设 计 者 可 以 在 命令 按钮 的 属性 表 中 修改 颜色 项 的 值 ， 来 改变 命令 按钮 对 象 的 color 
属性 。 这 一 修改 导致 调用 ( 由 应 用 程序 生成 器 提供 的 ) 对 象 的 某 个 方法 ， 该 方法 修改 对 象 的 
颜色 属性 ， 然 后 调用 相关 的 制图 引擎 方法 在 屏幕 上 重新 绘制 命令 按钮 。 

这 些 方法 也 可 以 由 应 用 程序 过 程 调用 ， 所 以 这 些 方法 可 以 在 运行 时 执行 ， 来 改变 表单 或 
控件 的 外 观 或 通过 文本 框 输入 /输出 信息 。 图 3-3 显 示例 程 的 组 织 方式 ,| 例如 ,一 个 应 用 程序 
过 程 在 运行 时 调用 过 程 form1.Show， 从 而 显示 一 个 名 为 form1 的 表单 。 
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图 3-3 应 用 程序 过 程 与 对 象 之 间 的 关系 


另 一 个 例子 ， 假 设 图 3-1 中 的 顶部 的 文本 框 的 ( 内部) 名 称 是 IDbox， 文 本 框 的 某 个 属性 
是 Text ( 即 文本 框 中 显示 的 字符 串 )。 应 用 程序 过 程 可 以 使 用 标记 IDbox.Text 访 问 读 字 符 审 
这 样 ，IDbox.Text 看 上 去 像 是 过 程 中 的 一 个 变量 。 过 程 可 以 读 取 该 变量 的 箱 或 者 给 它 赋 忆 个 新 
值 。 如 果 应 用 程序 过 程 想 用 IDbox 中 的 文本 给 另外 一 个 变量 st 赋值 ， ERREA PIER 

st = IDbox.Text 

RES ER VAO EET EE A 它 可 以 使 用 如 下 语句 : 

outbox.Text = "This is the text. 

在 这 两 个 实例 中 ， 赋 值 操 作 的 执行 调用 对 象 的 一 个 相关 方法 。 在 第 一 个 例子 中 ， 方 法 的 
作用 是 把 IDbox 的 数据 结构 中 Text 变 量 存储 的 值 ( Text 属 性 的 值 ) 赋 给 (程序 ) 变量 st。( 在 这 
个 例子 中 ， 对 象 方法 没有 影响 对 象 的 外 观 。) 在 第 二 个 例子 中 ， 赋值 方法 把 指定 的 字符 串 赋 给 
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outbox 文 本 框 的 数据 结构 中 的 Text 变 量 ， 然 后 调用 相关 的 制图 引擎 方法 改变 outbox 的 外 观 ， 从 
而 在 outbox 文 本 框 中 显示 出 指定 的 字符 串 。 

在 一 般 情况 下 ， 过 程 可 以 使 用 变量 

object_name.property_name 
访问 任何 对 象 的 任何 属性 ， 并 且 可 以 使 用 语句 

object_name.method_name (... arguments...) 
执行 对 象 的 方法 。 

正如 图 3-3 所 示 ， 应 用 程序 由 一 组 响应 指定 事件 的 应 用 程序 过 程 组 成 。 一 旦 应 用 程序 过 程 
被 调用 ， 它 就 可 以 使 用 与 所 显示 的 对 象 相关 联 的 属性 和 方法 来 访问 和 修改 屏幕 上 的 信息 。 注 
意 ， 应 用 程序 过 程 不 封装 在 对 象 模块 中 ( 像 上 面 提 到 的 方法 )。 它 们 访问 对 象 就 像 它们 访问 其 
他 的 全 局 声明 的 数据 结构 一 样 。 


3.7 访问 数据 库 和 执行 事务 


商业 应 用 程序 生成 器 在 提供 应 用 程序 访问 数据 库 和 执行 事务 的 功能 方面 差异 很 大 。 应 用 
程序 生成 器 至 少 应 该 为 应 用 程序 提供 如 下 的 能 力 : 

。 连 接 到 本 地 或 远程 服务 器 上 的 数据 库 。 

,在 数据 库 上 执行 SQL 语句 。 

。 在 服务 器 内 执行 存储 过 程 (如 果 服 务 器 支持 存储 过 程 的 话 )。 

。 利 用 服务 器 提供 的 事务 功能 。 

越 来 越 多 复杂 的 应 用 程序 生成 器 可 以 使 单个 事务 访问 若干 个 位 于 不 同 服务 器 的 数据 库 。 
我 们 会 在 第 10 章 更 详细 地 讲述 这 些 功能 ， 到 时 我 们 会 讨论 怎样 把 SQL 语句 和 其 他 数据 库 调用 
包含 进 应 用 程序 。 

1. 自动 生成 SQL 语 龟 

一 些 应 用 程序 生成 器 为 用 户 提供 创建 简单 数据 库 和 使 用 图 形 化 符号 来 生成 简单 查询 的 功 
能 。 用 这 种 方法 创建 的 查询 自动 被 翻译 成 SQL 或 与 SQL 等 价 的 语句 。 我 们 将 在 7.3 节 讨论 这 些 
可 视 化 查询 语言 的 概念 框架 。 

2. 数据 表单 

一 些 应 用 程序 生成 器 提供 高 度 的 抽象 ， 我 们 可 以 称 之 为 数据 表单 (data form) 有 时 称 为 
数据 页 (data page)。 对 设计 者 或 用 户 来 说 ， 数 据 表单 好 像 直 接连 接 到 数据 库 。 当 表单 一 开始 
显示 的 时 候 ， 表 单 中 的 文本 框 显 示 相 关 数据 库 的 值 。 无 论 何 时 用 户 改变 某 个 文本 框 中 的 值 ， 
数据 库 立 即 响应 并 更 新 数据 。 

使 用 事件 编程 的 概念 ， 可 以 很 容易 地 实现 数据 表单 。 表 单 的 显示 是 一 个 事件 ， 响 应 该 事 
件 的 应 用 程序 包含 一 个 从 数据 库 读 取信 息 的 SELECT 语句 并 且 把 这 些 信息 显示 在 表单 的 文本 框 
中 。 应 用 程序 生成 器 允许 用 户 使 用 图 形 化 符号 来 指定 SELECT 语句 。 

类 似 的 ， 当 用 户 改变 某 个 文本 框 中 的 值 ， 然 后 把 光标 移出 那个 文本 框 之 后 ， 一 个 change- 
of-focus 事 件 就 会 发 生 ， 该 事件 会 执行 一 个 更 新 数据 库 的 语句 。 该 语句 可 由 图 形 化 符号 指定 。 
设计 者 不 必 了 解 事件 编程 的 细节 就 可 以 创建 一 个 数据 表单 ， 如 果 图 形 化 符号 足够 简单 的 话 ， 
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甚至 可 以 不 必 了 解 SQL 编程 的 细节 。 

3. 面向 对 象 应 用 程序 语言 

如 果 应 用 程序 生成 器 提供 的 编程 语言 是 面向 对 象 的 ， 那 么 与 应 用 相关 的 实体 可 以 表示 为 
对 象 。 例 如 ， 在 学 生 注册 系统 中 ,程序 员 可 以 实现 一 个 称 为 course 的 对 象 类 ， 该 类 有 一 个 方法 
register 用 于 把 学 生 加 入 某 门 课程 。 因 为 关于 课程 注册 的 信息 保存 在 数据 库 中 ， 所 以 register 方 

对 象 (比如 course 或 student) 有 些 时 候 被 称 为 企业 对 象 (enterprise object) ， 因 为 它们 对 
应 于 企业 所 关心 的 基本 实体 。 对 数据 库 的 访问 可 以 封装 在 这 些 对 象 里 。 数 据 库 本 身 可 以 是 关 
系 的 或 面向 对 象 的 〈 见 第 16 章 )， 但 是 只 有 企业 对 象 的 方法 才 需 要 知道 模式 。 

使 用 企业 对 象 的 应 用 程序 过 程 响应 现实 的 事件 ， 当 它们 调用 可 视 化 对 象 的 方法 与 用 户 通 
过 GUI 交互 的 时 候 ， 应 用 过 程 强制 执行 企业 规则 。 例 如 ， 给 学 生 注册 课程 的 应 用 程序 过 程 可 
能 首先 调用 对 象 student 的 方法 (比如 ， 确 定 学 生 是 否 已 经 修 完 预备 课程 )， 然 后 调用 对 象 
course 的 方法 register。 

使 用 企业 对 象 ， 应 用 程序 过 程 可 以 用 于 实现 企业 需求 ， 而 不 必 知 道 任何 数据 库 设 计 的 知 
ik. 例如， 设计 注册 过 程 的 程序 员 不 必 知 道 数据 库 模 式 。 


3.8 ”详细 说 朋 学 生 注册 系统 


既然 我 们 已 经 知道 创建 一 个 GUI 是 多 么 的 容易 ， 那 么 我 们 就 可 以 回去 准备 学 生 注册 系统 的 
规格 说 明文 档 。 应 用 程序 生成 器 的 一 个 优点 是 ， 在 项 目的 需求 分 析 阶 段 ， 当 表单 和 控件 被 详 
细 说 明 后 ， 设 计 者 可 以 快速 地 实现 界面 的 简单 原型 并 显示 给 顾客 。 尽 管 这 些 原型 不 包含 实现 
交互 的 应 用 程序 过 程 ， 但 是 它们 可 以 让 顾客 感知 一 下 系统 的 外 观 。 然 后 顾客 可 以 提出 一 些 修 
改 和 改进 意见 ， 使 得 界面 对 用 户 来 说 更 实用 和 直观 。 

规格 说 明文 档 包含 对 系统 做 什么 的 完整 描述 ， 这 是 从 最 终 用 户 的 角度 来 说 明 的 一 一 它 是 
需求 文档 的 扩展 版 本 。 对 于 一 个 事务 处 理 系统 ， 规 格 说 明文 档 应 该 包括 以 下 内 容 : 

。 企 业 的 完整 性 约束 。 a 

。 为 每 个 表单 绘制 -- 张 图 片 ， 包 括 表单 中 的 每 个 控件 。 

。 当 一 个 控件 被 使 用 后 ， 所 发 生 的 事件 的 描述 ， 其 中 包括 : 

* 执行 哪个 应 用 程序 过 程 。 
“表单 中 发 生 什么 改变 ， 或 显示 哪个 新 表单 。 
“什么 情况 下 会 发 生 怎样 的 错误 ， 以 及 怎样 应 对 错误 。 
“ 每 个 交互 的 描述 ， 其 中 包括 : 
* 用户 输入 的 信息 ， 以 及 哪些 事件 导致 与 用 户 交 互 。 
。 交 互 行为 的 书面 描述 〈 例 如 ， 学 生 注册 课程 )。 
" 导致 交互 成 功 或 失败 的 条 件 的 列表 ， 以 及 在 每 种 条 件 下 将 会 发 生 什么 事情 。 

规格 说 明文 档 也 可 以 包括 其 他 关于 项 目 计划 的 信息 (比如 ， 时 间 计划 表 、 里 程 碑 、 可 交 

付 的 产品 列表 、 成 本 信息 等 等 )、 关 于 系统 问题 的 信息 (比如 ,运行 系统 所 必须 的 软件 和 硬件 ) 
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以 及 任何 时 间或 内 存 的 约束 。 学 生 注 册 系 统 的 规格 说 明文 档 的 目录 中 包含 下 面 几 部 分 。 

I 概述 

了 相关 文档 

区 表单 和 用 户 界 面 

NV 项 目 计 划 

A. 里 程 碑 

B. 可 交付 的 产品 列表 

注意 需求 文档 与 规格 说 明文 档 的 内 容 之 间 的 关系 。 

在 下 面 的 小 节 中 ， 我 们 介绍 规格 说 明文 档 中 第 亚 部 分 的 初始 内 容 。 我 们 将 在 5.7 节 给 出 学 
生 注册 系统 的 数据 库 设 计 ， 以 及 在 12.6 节 给 出 注册 事务 的 代码 设计 与 部 分 代码 内 容 。 


3.9 规格 说 明文 档 


规格 说 明文 档 的 第 于 部 分 (表单 和 用 户 界面 ) ua 与 用 户 交 互 的 详细 描述 。 它 的 初始 部 


分 的 描述 如 下 所 示 。 
o. 表单 和 用 户 界 面 
A. 当 进 入 学 生 注册 系统 ， 显 示 欢 迎 表单 Forml ( 见 图 3-1)。 在 Forml 中 
1. 填写 Id 和 Password 文 本 框 。 
2. 点 击 “OK” 命 令 按钮 ， 执 行 认证 交互 。 
a. 如 果 认 证 交互 失败 ， 显 示 Form2 (认证 错误 表单 )。 在 Form2 中 ， 点 击 “OK” 


命令 按钮 返回 Forml 。 

b. 如 果 认 证 交互 成 功 ， 而 且 用 户 是 个 学 生 ， 显 示 学 生 选 项 窗口 Form3 ( 见 规格 
说 明 B )。 

c. 如 果 认 证 交互 成 功 ， 而 且 用 户 是 个 教师 ， 显 示 教 师 选 项 窗口 Form4 ( 见 规格 说 
WAC). 


3. 点 击 “Exit” 按 钮 ， 显 示 确 认 退出 表单 Form5， 在 Form5 中 : 
a. 点 击 “Yes” 按 钮 ， 退 出 学 生 注 册 系 统 。 
b. 点 击 “No” 按 钮 ， 返 回 到 Form1。 

B. 如 果 认 证 交互 成 功 ， 并 且 所 认证 用 户 是 学 生 ， 则 显示 学 生 选 项 窗口 Form3: 

1. 如 果 选 择 课程 描述 菜单 选项 ， 将 执行 Get_Course_Names 交 互 ， 显 示 课 程 名 称 表 
单 Form6 ，Form6 包 括 : 
a. 课程 选项 框 被 选中 。 
b. 点 击 “OK” 按 钮 ， 将 运行 Get_Course_Description 交 互 ， 显 示 课 程 描述 表单 

Form7 。 
c. 点 击 “Cancel” 按钮 ， 返回 Form3 。 
规格 说 明文 档 的 第 三 部 分 的 剩余 内 容 与 此 类 似 ， 在 此 忽略 。 


日 ”我 们 省 略 其 他 表单 的 图 示 ; 它们 应 该 包含 在 实际 的 规格 说 明 中 。 
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3.10 参考 书目 


有 许多 优秀 的 介绍 软件 工程 的 书籍 ， 例 如 ，[Summerville 1996], [Pressman 1997]、[Schach 1990], 


[Blaha and Premerlani 1998] 是 介绍 数据 库 和 事务 处 理 系统 的 软件 工程 相关 内 容 的 一 本 好 书 。 


3.11 练习 


3.1 
3.2 


3.3 


3.4 


3.5 


3.6 


3.7 

3.8 

3.9 

3.10 
3.11 
3.12 
3.13 
3.14 
3.15 
3.16 


编写 一 个 关于 简单 的 计算 器 的 需求 文档 。 

根据 学 生 注 册 系 统 的 需求 文档 ， 一 个 会 话 可 能 包括 许多 交互 。 后 来 ， 在 设计 阶段 ， 我 们 会 将 每 个 交 
互 分 解 为 多 个 事务 。ACID 属 性 应 用 到 所 有 的 事务 ， 但 是 涉及 多 个 事务 的 会 话 可 能 不 是 孤立 的 或 者 
原子 性 的 。 例 如 ， 几 个 会 话 的 事务 可 能 是 相互 交 全 的。 解释 一 下 为 什么 会 话 可 以 不 是 独立 的 或 者 原 
子 性 的 。 为 什么 会 话 不 是 一 个 长 的 事务 ? 

假设 学 生 注 册 系 统 里 的 数据 库 满足 需求 文档 第 V 部 分 规定 的 所 有 完整 性 约束 ， 那 么 数据 库 就 肯定 正 
确 吗 ? 解释 原因 。 

学 生 注 册 系 统 的 需求 文档 并 不 涉及 安全 问题 。 编 写 一 个 关于 安全 问题 的 问题 ， 可 以 将 其 包括 在 一 个 
更 现实 的 需求 文档 中 。 

在 3.3 节 问题 2 的 解决 方案 中 提 到 ， 新 的 预备 课程 不 适合 下 学 期 开设 的 课程 。 注 册 事务 怎样 知道 该 预 
备课 程 是 一 门 新 的 课程 ? 

假设 扩展 学 生 注册 系统 使 之 包括 毕业 生 的 清除 。 描 述 一 些 必 须 存储 在 数据 库 中 的 额外 的 信息 以 及 完 
整 性 约束 。 

使 用 本 地 应 用 程序 生成 器 完成 图 3-1 所 示 的 窗 体 。 

列 出 本 地 应 用 程序 生成 器 所 生成 的 所 有 的 命令 按钮 对 象 属性 。 

列 出 本 地 的 应 用 程序 生成 器 所 生成 的 所 有 的 命令 按钮 对 象 的 (用 户 可 见 的 ) 方法 。 

列 出 本 地 的 应 用 程序 生成 器 所 生成 的 所 有 的 控制 对 象 。 

列 出 本 地 的 应 用 程序 生成 器 所 提供 的 能 触发 过 程 调用 的 所 有 事件 。 

描述 本 地 的 应 用 程序 生成 器 所 提供 的 和 数据 库 交互 的 工具 。 

使 用 本 地 的 应 用 程序 生成 器 实现 tic-tac-toe 游 戏 。 在 该 游戏 中 ， 用 户 与 系统 对 双 (但 是 用 户 不 会 赢 )。 
编写 一 个 关于 简单 的 计算 器 的 规格 说 明文 档 。 

使 用 本 地 的 应 用 程序 生成 器 实现 一 个 简单 计算 器 。 

编写 一 个 关于 如 何 控制 微波 炉 的 规格 说 明文 档 。 





第 二 部 分 
数据 库 管 理 


现在 我 们 准备 开始 学 习 数 据 库 系统 。 

第 4 章 讨 论 在 现代 数据 库 管 理 系统 (DBMS) 中 如 何 说 明 数 据 项 
以 及 在 事务 中 如 何 使 用 它们 。 换 言 之 ， 我 们 将 学 习 一 些 关 于 数据 模 
型 和 数据 定义 语言 的 知识 。 

第 6、7 和 9 章 将 讨论 通过 数据 操纵 和 查询 语言 (特别 是 SQL) 完 
成 数据 库 管 理 系统 中 的 事务 访问 和 数据 修改 。 

第 10 章 介绍 如 何在 C 或 Java 这 样 的 宿主 语言 中 使 用 SQL 语句 。 

第 5 章 和 第 8 章 中 ， 我 们 将 探讨 设计 数据 结构 的 技术 ， 数 据 库 的 设 
计 怎 样 影响 只 读 事务 (NAW) 和 更 新 事务 之 间 的 基本 权衡 。 

第 11、13 和 14 章 讨论 数据 库 中 使 用 的 数据 组 织 和 查询 处 理 技术 。 
它们 对 调整 数据 库 性 能 举足轻重 。 在 5.7 节 和 第 12 章 ， 我 们 将 运用 这 
些 方法 设计 学 生 注册 系统 。 

第 15 章 对 事务 处 理 作 简要 的 介绍 。 事 务 处 理 是 数据 库 最 重要 的 应 
用 领域 之 一 。 





BA 关系 数据 模型 


本 章 介 绍 关系 数据 模型 。 首先， 我 们 定义 关系 数据 模型 中 一 些 主要 的 抽象 概念 ， 进 而 在 
SQL 的 具体 语法 中 来 说 明 它 们 。 特 别 地 ， 本 章 包含 SQL 的 数据 定义 子 集 ， 该 子 集 可 以 定义 数 
据 库 中 的 数据 结构 、 约 束 和 授权 机 制 。 


4.1 什么 是 数据 模型 


1. 数据 独立 

尽管 最 终 所 有 的 数据 都 以 字 节 的 形式 记录 在 磁盘 上 ， 但 作为 程序 员 应 该 知道 ， 若 直接 使 
用 这 些 抽象 级 别 很 低 的 数据 则 会 很 乏味 。 没 人 对 如 何 分配 遍 区、 磁道 和 柱 面 来 存储 信息 感 兴 
趣 ， 大 多 数 程序 员 倾 向 用 文件 这 样 对 应 用 程序 来 说 更 合理 的 抽象 形式 来 存储 数据 。 

在 学 习 文 件 结构 的 课程 中 ， 读 者 可 能 已 熟悉 在 文件 中 存储 数据 的 多 种 方法 。 顺 序 
(sequential) 文件 最 适合 按照 数据 存储 的 顺序 来 访问 它们 的 应 用 程序 。 如 果 访 问 记 录 的 顺序 是 
随机 的 ， 则 直接 访问 (direct access) 或 随机 访问 (random access) 形式 的 文件 将 最 适合 。 可 
为 文件 作 索 引 (index ) ， 它 是 一 种 辅助 数据 结构 ， 可 使 应 用 程序 基于 搜索 键 (search key) 来 
检索 记录 。 在 第 11 章 中 我 们 会 详细 讨论 各 种 索引 类 型 。 文 件 的 记录 可 以 是 定 长 或 不 定 长 的 。 

文件 中 数据 如 何 存储 的 细节 属于 数据 建 模 的 物理 层 (physical level)。 在 数据 库 领 域 ， 该 
层 也 称 为 物理 模式 (physical schema) ， 它 是 描述 文件 和 索引 结构 的 语法 。 

早期 数据 密集 型 的 应 用 程序 直接 工作 在 物理 模式 ， 而 不 像 现 代数 据 库 管理 系统 那样 提供 
高 级 的 数据 抽象 。 早 期 的 应 用 程序 这 样 做 是 有 原因 的 。 其 一 ， 商 业 数 据 库 系 统 很 少 且 很 昂贵 。 
其 二 ， 对 慢 速 的 计算 机 而 言 ， 直 接 使 用 文件 系统 可 提供 不 错 的 性 能 。 其 三 ， 从 今天 的 标准 看 ， 
大 多 数 早期 的 应 用 程序 都 很 原始 ， 在 程序 和 文件 系统 之 间 再 构建 一 层 抽象 似乎 不 大 合理 。 

该 方法 的 最 大 缺点 是 物理 层 文件 格式 的 改变 会 带 来 昂贵 的 软件 维护 费用 。“ 千 年 问题 ” 即 
是 很 好 的 例子 。 在 20 世 纪 的 60 和 70 年 代 ， 程 序 中 普遍 采用 2 位 数字 的 硬 编码 来 表示 日 期 中 的 年 
份 。 其 出 发 点 在 于 这 些 程序 会 在 15 ~ 20 年 内 都 被 替换 掉 ， 因 此 用 4 位 数字 (或 使 用 DATE 这 样 
的 数据 类 型 ) 会 浪费 磁盘 空间 。 结 果 造 成 每 个 用 到 日 期 的 例 程 都 用 2 位 数字 来 查找 年 份 。 因 此 ， 
者 改变 日 期 格式 则 需要 查找 和 修正 程序 中 的 所 有 代码 。Y2K 问 题 在 上 个 世纪 90 年 代 使 业界 花 
费 数 十 亿美 元 来 更 新 软件 。 

如 果 那 些 程序 中 使 用 DATE 这 样 的 数据 抽象 ， 那 么 所 有 的 问题 都 可 以 被 避免 。 即 使 年 份 在 
数据 库 中 还 是 以 2 位 数字 进行 物理 存储 ， 但 应 用 程序 仍然 可 以 将 年 份 看 作 是 4 位 数字 。 在 千年 . 
虫 问题 上 ， 设 计 者 只 需要 把 数据 库 中 年 份 的 物理 表示 改 成 4 位 数字 即 可 ， 具 体 做 法 是 先 写 一 个 
简单 的 程序 把 数据 库 中 的 每 个 年 份 字段 都 加 上 1900， 然 后 相应 地 ， 将 实现 函数 都 用 DATE 数 据 
类 型 来 访问 新 的 物理 表示 。 这 样 一 来 ， 现 有 程序 都 无 需 再 作 修 改 ， 因 为 它们 仍然 可 以 使 用 同 
样 的 DATE 数 据 抽象 。 
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在 需要 修改 基本 的 数据 结构 (即使 不 频繁 ) 的 情况 下 ， 数 据 密 集 型 应 用 程序 的 设计 如 果 
基于 单纯 的 文件 系统 则 会 存在 问题 。 即 使 是 细微 的 改变 ， 例 如 在 文件 中 增加 或 删除 一 个 字段 
也 意味 着 用 到 该 文件 的 所 有 应 用 程序 都 必须 手工 更 新 ， 重 编译 和 重新 测试 。 再 细小 的 改变 
(如 合并 两 个 字段 或 将 一 个 字段 一 分 为 二 ) 都 可 能 非常 显著 地 影响 现存 的 应 用 程序 。 适 应 这 样 
的 改变 将 带 来 繁重 的 工作 甚至 出 错 。 此 外 ， 需 要 在 原始 文件 中 将 数据 转换 为 新 的 形式 ， 这 需 
要 合适 的 工具 来 完成 ， 否 则 代价 将 极为 昂贵 。 

而 且 ， 对 于 需要 频繁 查询 和 使 新 查询 快速 实现 的 应 用 程序 的 开发 ， 文 件 系统 提供 的 数据 
抽象 级 别 过 低 。 对 于 这 些 应 用 程序 ， 概 念 层 (conceptual level) 的 数据 建 模 是 合适 的 。 

概念 模式 隐藏 物理 数据 表示 的 细节 ， 取 而 代 之 的 是 用 高 级 概念 来 描述 数据 ， 它 们 更 接近 
于 人 们 看 待 数据 的 方式 。 例 如 ， 概 念 模式 (conceptual schema ， 在 概念 层 描 述 数据 的 语法 ) 
能 够 像 下 面 这 样 描述 学 生 的 信息 : 

STUDENT (Id: INT, Name: STRING, Address: STRING, Status: STRING) 

尽管 该 模式 看 上 去 类 似 于 文件 记录 的 方式 ， 但 很 重要 的 一 点 在 于 该 模式 描述 的 信息 片断 
可 能 在 物理 上 存储 的 形式 与 模式 描述 的 方式 不 同 。 实 际 上 ， 信 息 片断 可 能 存储 在 别 的 文件 中 
(其 至 在 别 的 计算 机 上 ) 。 

物理 层 和 概念 层 上 的 模式 分 离 产 生 了 简单 但 有 效 的 物理 数据 独立 (physical data independence ) 
思想 。 应 用 程序 不 再 和 文件 系统 直接 打交道 ， 而 只 看 到 概念 模式 。 数 据 库 管理 系统 自动 地 在 概 
念 模式 和 物理 模式 间 映 射 数据 。 如 果 物 理 表示 改变 ， 所 要 做 的 只 是 改变 这 两 层 之 间 的 映射 。 所 
有 的 应 用 程序 由 于 仅 和 概念 模式 打交道 ， 因 此 在 新 的 物理 数据 结构 下 仍然 正常 工作 。 

在 对 数据 抽象 的 过 程 中 ， 概 念 模式 还 不 是 最 终 的 结果 。 第 三 层 的 抽象 称 为 外 部 模式 
(external schema， 也 称 为 用 户 (user) 或 视图 (view) 抽象 层 )。 外 部 模式 用 于 定制 概念 模式 
来 满足 各 种 用 户 的 需要 ， 另 外 它 在 数据 库 安全 方面 也 起 到 重要 作用 (我 们 将 在 后 文 讨论 ) 。 

外 部 模式 看 上 去 像 概念 模式 ， 现 代数 据 库 管理 系统 基本 上 以 相同 的 方式 定义 这 两 种 模式 。 
然而 ， 尽 管 每 个 数据 库 只 有 一 个 简单 的 概念 模式 ， 但 它 可 能 有 多 个 外 部 模式 ( 即 在 概念 模式 
上 的 视图 )， 通 常 每 类 用 户 一 个 。 比 如 ， 为 生成 学 生 的 账单 信息 ， 学 校 财 务 宝 需 要 知道 每 个 学 
生 的 GPA 和 他 的 总 学 分 ， 但 对 于 课程 名 和 成 绩 则 不 关心 。 即 使 GPA 和 学 分 在 数据 库 中 没有 显 
式 地 存储 ， 财 务 室 仍 可 以 获得 具有 这 些 项 的 视图 ， 这 些 项 就 像 普通 字段 ( 当 访问 字段 时 ， 这 
些 普通 字段 的 值 在 运行 时 计算 出 来 ) 那样 显示 出 来 ， 而 那些 和 账单 信息 无 关 的 字段 和 关系 都 
将 被 忽略 。 类 似 地 ， 学 生 的 指导 老师 不 必 知 道 任 何 账单 信息 ， 因 为 从 他 们 看 待 注册 系统 的 角 
度 ， 这 些 信息 也 可 以 忽略 。 

以 上 现 点 带 来 概念 数据 独立 (conceptual data independence) 的 原则 适合 特定 用 户 群 的 
应 用 程序 可 以 使 用 适合 该 用 户 群 的 外 部 模式 。 外 部 模式 和 概念 模式 之 间 的 映射 由 数据 库 管理 
系统 负责 ， 四 此 应 用 程序 从 概念 模式 的 改变 以 及 物理 模式 的 改变 中 都 本 离 出 来 总 体 结构 如 
图 4-1 所 示 。 

2. 数据 模型 

一 个 数据 模型 (data model) 包含 工具 和 用 于 描述 以 下 内 容 的 语言 。 

1) 概念 模式 和 外 部 模式 。 模 式 指定 数据 库 中 数据 存储 的 结构 。 模 式 用 数据 定义 语言 
(Data Definition Language, DDL) 描述 。 
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图 4-1 数据 独立 的 层次 


2) 约束 。 约 束 指定 数据 库 中 数据 项 必须 满足 的 条 件 。 约 束 规范 语言 一 般 是 DDL 的 子 语言 。 

3) 数据 上 的 操作 。 数 据 库 项 上 的 操作 用 数据 操纵 语言 (Data Manipulation Language, 
DML) 来 描述 。DML 通 常 是 任何 数据 模型 中 最 重要 也 最 受 关注 的 部 分 ， 因 为 这 些 操作 最 终 为 
用 户 产 生 高 级 的 数据 抽象 。 

此 外 ， 所 有 商业 系统 会 提供 某 种 存储 定义 语言 ( Storage Definition Language，SDL), 它 
允许 数据 库 设 计 者 改变 物理 模式 (虽然 大 多 数 系统 保留 最 后 的 定义 权 )， SDL 通 常 紧密 地 与 
DDIL 集 成 。 若 数据 库 管理 员 引 入 新 的 SDL 语 句 ， 则 物理 模式 可 能 会 改变 ， 但 这 种 改变 不 会 影 
响应 用 程序 的 语义 ， 原因 在 于 物理 数据 独立 性 将 应 用 程序 与 物理 改变 屏蔽 开 来 。 因 此 ， 尽 管 
应 用 程序 的 性 能 会 受 影响 ,但 是 它 产 生 的 结果 不 会 受到 影响 。 

在 后 面 的 儿 节 中 ， 我 们 描述 商业 数据 库 管理 系统 中 所 有 数据 模型 的 基础 ， 即 关系 模型 和 
这 些 数据 库 管理 系统 所 讲 的 语言 : 结构 化 查询 语言 (SQL)。 注 意 ，SQL 不 只 仅仅 是 查询 语言 ， 
它 是 由 DML、DDL 和 SDL 组 合 而 成 的 。 


4.2 关系 模型 


关系 数据 模型 (relational data model) 由 E.F.Codd 在 1970 年 提出 ， 它 在 当时 是 数据 库 领域 
中 的 重大 突破 。 事实 上 ， 在 20 世 纪 70 和 80 年 代 ， 数据 库 研究 和 开发 很 大 程度 上 是 由 Codd 的 开 
创 性 工作 所 左右 的 [Codd 1970,1990]. HEAR, 尽管 大 多 数 的 商业 数据 库 管 理 系统 已 经 开 
始 加 入 面向 对 象 的 特性 ， 但 它们 的 基础 仍然 是 关系 模型 。 

关系 模型 主要 的 吸引 力 在 于 它 构 建 在 简单 且 自然 的 数学 结构 关系 (或 表 ) 上 。 关 系 
包含 一 组 功能 强大 且 高 级 的 操作 ， 数据 操纵 语言 植 根 于 数学 逻辑 上 。 坚 固 的 数学 基础 意味 着 
关系 表达 式 (MAW) 可 以 被 分 析 。 因 此 ， 任何 关系 表达 式 能 够 被 等 价 地 转化 为 另外 一 种 形 
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式 ， 在 这 种 形式 下 ， 表 达 式 可 以 在 查询 优化 过 程 中 更 加 有 效 地 执行 。 这 样 ， 程 序 员 不 必 研 究 
每 个 数据 库 内 部 的 本 质 细 节 ， 也 不 必 知 道 查询 评估 系统 是 如 何 工作 的 。 他 们 只 需要 以 自然 且 
简单 的 方式 构建 某 个 查询 ， 然 后 再 发 给 查询 优化 器 让 它 找 出 执行 效率 更 高 的 等 价 查 询 。 

然而 ， 查 询 优 化 器 也 有 局 限 性 ， 对 于 某 些 复杂 的 查询 会 导致 性 能 上 的 退化 。 因 此 程序 员 
和 数据 库 设 计 者 都 应 该 理解 他 们 所 用 的 语法 ， 掌 担 相应 的 知识 ， 这 样 程序 员 写 出 的 查询 会 更 
容易 由 数据 库 管 理 系 统 优 化 ， 而 数据 库 设 计 者 通过 增加 合适 的 索引 以 及 使 用 其 他 的 设计 技术 
可 提高 重要 查询 的 性 能 。 


4.2.1 基本 概念 


关系 模型 的 中 心 是 关系 (relation )。 一 个 关系 是 模式 (schema) 和 该 模式 实例 (instance) 
的 组 合 。 

1. 关系 实例 

关系 实例 只 是 由 命名 的 若干 列 和 行 组 成 的 表格 。 在 不 会 产生 混淆 的 情况 下 ， 我 们 就 用 
“关系 ” 指 代 关 系 实例 。 关 系 中 的 行 称 为 元 组 (tuple )， 它 们 就 像 文件 中 的 记录 一 样 ， 但 与 文 
件 记 录 的 不 同 之 处 是 ， 所 有 的 元 组 的 列 数 相同 (该 数目 称 为 关系 的 元 数 )， 并 且 一 个 关系 实际 
中 不 存在 两 个 相同 的 元 组 。 换 名 话说 ， 关 系 实例 是 唯一 元 组 的 集合 。 关 系 实例 中 元 组 的 数目 
称 为 基数 (cardinality ) 。 

图 4-2 是 STUDENT 关系 的 一 个 实例 。 在 关系 模型 中 ， 关 系 中 的 列 一 般 都 应 该 被 命名 ， 它 们 
也 被 称 为 属性 (attribute )。 而 且 ， 由 于 关系 是 元 组 的 集合 ， 所 以 元 组 的 次 序 是 无 关 紧 要 的 。 
类 似 地 ， 由 于 列 已 经 被 命名 ， 所 以 它们 在 表 中 的 次 序 也 是 不 重要 的 。 图 4-2 和 图 4-3 是 同一 个 


关系 。 


111111111 | John Doe 123 Main St. Freshman 
666666666 Joseph Public 666 Hollow Rd. 
111223344 | Mary Smith 1 Lake St. 
987654321 Fox 5 TV 
023456789 Fox 5 TV 
123454321 6 Yard Ct. 
















Sophomore 



















Freshman 
















Bart Simpson Senior 













Homer Simpson Senior 





Joe Blow Junior 


图 4-2 STUDENT 关系 的 实例 
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图 4-3 列 和 元 组 顺序 不 同 的 SrupENT 关 系 实例 
请 读者 注意 ， 术 语 “ 元 组 ”"、“ 属 性 ”和 “关系 ”一 般 用 在 关系 数据 库 理 论 中 ; 而 “ 行 ” 
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“ 列 ” 和 “ 表 ” 一 般 用 在 SQL 中 。 尽 管 如 此 ， 这 些 术语 可 以 互相 替换 使 用 。 

一 个 关系 的 任何 行 中 的 属性 值 的 取 值 范围 是 一 个 集合 ， 称 之 为 该 属性 的 域 (domain)， 比 
如 ，STUDENT 表 中 的 Address 属 性 ， 其 取 值 域 是 所 有 字符 串 的 集合 。 域 中 这 些 值 要 满足 一 个 重 
要 的 需求 ， 即 数据 原子 性 (data atomicity) 9 。 数 据 原子 性 不 是 指 这 些 值 不 能 再 分 解 。 正 如 上 
面 的 例子 中 所 示 ， 值 可 以 是 字符 串 ， 它 们 是 可 以 再 分 的 。 数 据 原子 性 的 含义 是 关系 模型 不 会 
采用 任何 手段 进一步 观察 这 些 值 的 内 部 结构 ， 对 关系 操作 符 来 说 好 像 它们 是 不 可 分 的 。 

该 原子 性 限制 对 关系 模型 来 说 有 时 是 一 种 缺陷 。 大 多 数 的 商业 系统 会 放宽 这 个 限制 ， 有 
些 系统 干脆 去 除 恋 限 制 ， 于 是 对 象 一 关系 (object-relational) 这 样 的 新 数据 模型 应 运 而 生 。 
我 们 将 在 第 16 章 再 介绍 对 象 -关系 模型 这 个 内 容 。 

2. 关系 模式 

一 个 关系 模式 (relation schema) 包括 如 下 的 部 分 : 

1) 关系 名 。 关 系 名 在 数据 库 中 必须 唯一 。 

2) 关系 中 的 属性 的 名 字 以 及 相关 联 的 域名 。 属 性 名 即 是 赋予 关系 实例 中 列 的 名 字 。 关 系 
中 所 有 的 列 都 必须 被 命名 ， 且 同一 关系 中 的 列 不 能 重 名 。 域名 (domain name) 是 为 定义 良好 
的 值 集 所 赋予 的 名 字 。 在 编程 语言 中 ， 域 名 通常 称 为 类 型 。 例 如 整 型 (INTEGER )、 实 型 
(REAL) 和 字符 串 (STRING), 

3) 完整 性 约束 (Integrity Constraint，IC)。 它 是 施加 在 该 关系 模式 实例 上 的 限制 (也 就 是 
说 ， 限时 上 元 组 可 以 出现 在 一 个 关系 实例 中 只 有 当 一 个 实例 满足 模式 的 所 有 完整 性 约束 
时 ， 它 才 是 合法 (legal) 的 。 

为 说 明 这 些 概念， 我 们 回顾 上 面 提 到 过 二 的 模式 : 

STUDENT (Id:INTEGER, Name:STRING, Address:STRING, Status:STRING) 

该 模式 确定 STUDENT 关 系 必须 有 4 个 属性 : 1d，Name，Address 和 Status， 它 们 对 应 的 域 是 
INTEGER 和 STRING”。 如 该 例 所 示 ， 同 一 个 模式 中 不 同 的 属性 名 字 都 不 一 样 ， 但 它们 可 以 
有 相同 的 域 。 

域 指明 STUpENT 关 系 的 字段 Id 的 所 有 值 必须 属于 整 型 域 ， 而 其 他 列 的 值 都 属于 字符 串 。 我 
们 很 自然 地 假设 整 型 域 包含 所 有 的 整数 ， 而 字符 串 域 包含 所 有 的 字符 串 。 然 而 ， 模 式 中 可 以 
有 用 户 自 定 义 的 域 ， 比 如 SSN 或 STATUS 域 ， 它 们 包含 适合 属性 的 精确 值 。 比 如 ， 可 以 定义 
STATUS 域 只 包含 “freshman”、 “sophomore” 等 ， 定 义 SSN 域 包含 所 有 的 9 位 正 数 (但 也 仅仅 
包含 9 位 的 正 数 )。 以 上 讨论 的 是 施加 于 关系 模式 的 所 谓 的 类 型 约束 。 

若 $ 是 关系 模式 ，s 是 一 个 关系 实例 ， 则 类 型 约束 (type constraint) 要 求 s 必 须 满 足下 面 两 


个 条 件 : 
“ 列 命名 s 中 的 每 个 列 必须 对 应 于 S 中 的 属性 (反之 亦 然 )， 并 且 列 名 必须 和 对 应 的 属性 
名 字 相 同 。 


RR 对 每 个 在 S 中 的 属性 - 域 对 <attr: DOM> ，s 中 的 列 attr 的 值 必 须 属于 域 DOM。 


O ”这 里 的 数据 原子 性 和 事务 原子 性 无 关 ， 切 勿 混淆 它们 。 
O Id 属性 可 以 用 字符 串 来 表示 ， 这 对 某 些 大 学 可 能 是 更 合适 的 ; 但 是 整数 表示 更 节省 空间 ， 选 择 使 用 它 仅 仅 
是 为 了 进行 说 明 。 l 
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下 面 我 们 会 看 到 ， 类 型 约束 只 是 和 关系 模式 相关 的 几 个 约束 之 一 。 模 式 的 实例 必须 满足 
所 有 这 些 约束 。 

3. 关系 数据 库 

关系 数据 库 (relational database) 是 关系 的 有 限 集 。 因 为 关系 由 两 部 分 组 成 ， 所 以 关系 数 
据 库 也 是 由 两 部 分 组 成 ， 即 关系 模式 的 集合 (和 另外 的 实体 ， 这 些 实体 我 们 只 做 简 述 ) 以 及 
对 应 的 关系 实例 的 集合 。 关 系 模式 的 集合 称 为 数据 库 模式 (database schema) ， 对 应 的 关系 实 
例 的 集合 称 为 数据 库 实 例 (database instance )。 在 不 产生 混淆 的 情况 下 ， 一 般 也 用 术语 “数据 
库 ” 指 代数 据 库 实例 。 图 4-4 是 学 生 注册 系统 的 数据 库 模 式 的 片断 。 图 4-5 是 对 应 该 关系 模式 的 
数据 库 实例 的 例子 。 我 们 看 到 每 个 关系 都 满足 对 应 模式 所 指定 的 类 型 约束 。 


STUDENT (Id:INTEGER, Name:STRING, Address:STRING, Status:STRING ) 

PROFESSOR(Id:INTEGER, Name:STRING, DeptId:DEPTS) 

COURSE (DeptId:DEPTS, CrsCode:COURSES, CrsName:STRING, 
Descr : STRING) 


TRANSCRIPT (StudId:INTEGER, CrsCode: COURSES, Semester:SEMESTERS, 
Grade : GRADES) 
TEACHING (ProfId:INTEGER, CrsCode:COURSES, Semester :SEMESTERS) 





图 4-4 学 生 注册 数据 库 模式 的 片断 


4.2.2 完整 性 约束 


我 们 在 2.2 节 曾 讨论 过 完整 性 约束 在 应 用 程序 中 起 的 作用 。 现 在 结合 数据 库 模式 再 来 考察 
它们 。 完 整 性 约束 (IC) 是 关于 数据 库 中 所 有 合法 实例 的 语句 。 也 就 是 说 ， 这 些 关系 实例 必 
须 满 足 所 有 和 数据 库 模 式 相 关 的 完整 性 约束 。 前 面 我 们 已 经 研究 过 类 型 约束 和 域 约束 ， 后 面 
我 们 会 看 到 其 他 类 型 的 约束 。 

有 些 完整 性 约束 是 基于 企业 的 业务 规则 的 。 比 如 ,“ 所 有 雇员 的 收入 不 应 该 超过 老板 ”就 
是 这 样 一 个 约束 。 这 些 约束 一 般 在 应 用 程序 的 需求 文档 中 列 出 。 其 他 的 约束 (比如 类 型 和 域 
约束 ) 则 基于 模式 设计 ， 由 数据 库 设计 者 指定 。 

因为 完整 性 约 东 属于 数据 库 模式 的 一 部 分 ， 它 们 通常 在 一 开始 的 模式 设计 中 就 被 指定 。 
当然 也 可 以 在 数据 库 已 创建 好 且 导 入 数据 后 再 增加 或 删除 一 个 完整 性 约束 。 一 旦 在 模式 中 指 
定 约束 ， 数 据 库 管理 系统 就 应 当 保证 在 事务 执行 过 程 中 不 被 违反 这 些 约束 。 

一 个 完整 性 约束 可 以 只 限于 关系 内 (intra-relational) ， 即 它 只 涉及 到 一 个 关系 ; 它 也 可 以 
是 关系 间 (inter-relational) 的 ， 即 它 涉及 到 多 个 关系 。 类 型 约束 就 是 关系 内 IC 的 例子 。 再 看 另 
外 一 个 例子 ， 有 一 个 约束 ， 它 规定 STUDENT 表 的 实例 所 有 行 的 Id 属性 值 必 须 唯 一 ， 该 约束 称 为 
键 约束 (key constraint， 键 约束 将 在 后 面 的 内 容 中 介绍 )。 断 言 每 位 授课 的 教授 的 Id 属性 的 值 必 
须 是 出 现在 PRoFESsSoR 表 中 的 某 一 行 的 ID 属性 中 的 值 就 是 一 个 关系 间 的 约束 ， 这 个 约束 称 为 外 
键 约束 (foreign key constraint) (将 在 后 面 讨 论 )。 而 “员工 收入 不 能 超过 老板 ”9 的 规则 既 可 
以 是 关系 内 约束 也 可 以 是 关系 间 约 束 ， 这 取决 于 薪水 信息 和 公司 管理 结构 信息 是 否 存 储 在 相同 
的 关系 中 ， 该 约束 属于 语义 约束 的 类 型 ， 该 约束 也 将 在 本 节 后 面部 分 中 描述 。 


O 到 目前 为 止 ,我 们 不 必 担 心 特 殊 情 况 ， 比 如 对 公司 总 裁 应 用 此 约束 ， 而 总 裁 没 有 老板 。 
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图 4-5 数据 库 实 例 片断 
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现在 介绍 的 约束 都 是 静态 的 完整 性 约束 (Static IC)。 动 态 的 完整 性 约束 (dynamic IC) 的 
不 同 点 在 于 : 它们 不 是 限制 关系 实例 在 数据 库 中 的 合法 性 ， 而 是 限制 它们 的 变化 。 这 种 约束 
对 表示 企业 的 业务 规则 特别 有 用 。 例 如 ， 规 定 每 个 事务 中 薪水 的 上 涨 或 下 降 比 例 不 可 超过 5%。 
再 例如 ， 规 定 一 个 人 的 婚姻 状况 不 能 从 单身 变 到 离婚 。 银 行 可 能 会 有 这 样 的 业务 规则 ， 若 发 
生 透 支 ， 则 根据 信用 贷款 的 最 高 限额 ， 通 过 现金 转账 ， 在 下 个 营业 日 前 必须 补 交 所 欠 金 额 。 

但 是 ， 主 流 的 数据 操纵 语言 (如 SQL ) 和 商业 的 数据 库 管理 系统 并 没有 为 动态 约束 的 自 
动 执 行 提 供 很 多 支持 。 因 此 ， 若 一 个 事务 更 新 数据 库 ， 则 应 用 程序 设计 者 必须 提供 代码 执行 
该 事务 中 的 约束 。 由 于 没有 简便 的 办 法 来 验证 事务 是 否 真 的 遵守 那些 规则 ， 数 据 库 完 整 性 只 
好 依赖 于 实现 事务 团队 的 设计 、 编 码 和 质量 保证 的 能 力 。 

满足 静态 完整 性 约束 则 容易 的 多 。 与 动态 完整 性 约束 相 比 ， 它 们 既 容 易 指 定 也 容易 执行 
本 节 我 们 讨论 了 最 普遍 的 静态 完整 性 约束 。 之 后 的 几 节 将 介绍 如 何在 SQL 中 描述 静态 完整 性 
约束 。 

1. 键 约束 

读者 已 经 看 到 键 约束 的 一 个 例子 ， 即 SrupENT 表 实例 中 的 Id 属性 值 必 须 唯 一 。 对 于 更 复杂 
的 例子 ， 可 考虑 TRANSCRIPT 这 个 关系 。 一 般 来 说 ， 可 以 假定 对 任 一 个 学 期 的 任 一 门 课 ， 学 生 
都 会 有 一 个 最 终 的 成 绩 ， 我 们 进而 可 指定 {StudId，CrsCode，Semester} 作为 一 个 键 。 该 规 
格 说 明 保 证 对 属性 Studld、CrsCode 和 Semester 的 任意 给 定 值 ， 表 中 至 多 只 有 一 条 成 绩 记 录 对 
应 这 些 值 。 若 该 元 组 真 的 存在 ， 那么 它 指 定 某 个 学 生 在 某 个 学 期 的 某 门 课 的 唯一 成 绩 。 

有 直观 的 认识 后 ， 再 来 看 看 键 约束 更 加 精确 的 定义 。 和 关系 模式 S 关 联 的 键 约束 key( K) 
由 S$ 中 属性 的 子 集 天 组 成 ， 并 有 如 下 的 性 质 : 车 S 的 实例 s 不 包含 这 样 的 两 个 不 同 的 元 组 ， 即 
元 组 中 属于 的 每 个 属性 其 值 都 对 应 相同 ， 则 s 满 足 key( K). 

模式 S 的 每 个 键 约束 key( 天 ) 都 假定 有 一 个 确定 的 最 小 值 性 质 : key( 正 ) 的 子 集 不 能 再 是 S 
的 键 约束 。 因 此 ， 若 4 和 8 是 属性 ， 则 不 允许 指定 {4} 和 {4, 8B} 都 是 同一 关系 中 的 键 。 此 外 ， 若 
{A, 引 是 键 ， 则 对 于 属性 4 和 B， 最 多 只 有 一 个 元 组 允许 有 {e, 5} 这 样 的 一 对 值 。 然 而 ， 不 同 的 
元 组 对 于 属性 4 可 能 会 有 相同 的 值 ， 但 在 B 中 不 会 有 相同 的 值 ; 反之 亦 然 。 

这 样 ， 在 TRANSCRIPT 关 系 中 倘若 某 个 学 生 在 不 同 的 学 期 中 都 修 某 门 课程 ， 则 很 可 能 会 有 
不 同 的 元 组 记录 该 学 生 该 门 课 的 成 绩 。 同 样 地 ， 也 不 限制 某 个 学 生 在 同一 个 学 期 中 学 习 几 门 
不 同 的 课 。 

关于 键 这 个 概念 有 以 下 三 点 需要 注意 :， 

1) 车 key( 天 ) 是 模式 S 的 键 约束 ， 工 是 S 中 属性 的 集合 且 S 中 包含 入， 那么 S 的 合法 实例 不 
应 该 包含 这 样 的 不 同 元 组 ， 它 们 中 属于 工 的 每 个 属性 都 对 应 相同 。 实 际 上 ， 对 于 荆 中 的 每 个 
属性 ， 若 元 组 1 和 元 组 ;都 有 同样 的 值 ， 则 对 于 天 中 的 每 个 属性 它们 也 肯定 有 同样 的 值 。 但 由 
于 key( 下 ) 是 键 约束 ， 所 以 1 和 s 必 定 是 同一 个 元 组 。 , E 

由 以 上 观点 可 以 产生 下 面 的 概念 : S 中 包含 键 的 属性 集 称 为 S 的 超 键 (superkey )。 超 键 可 
能 恰好 是 键 , 但 也 可 以 有 不 是 键 的 超 键 。 比 如 ， 在 TRANsCRIPT 这 个 例子 中 ，{StudId，CrsCode，, 
Semester} 既 是 超 键 也 是 键 。{StudId，CrsCode，Semester，Grade} 是 超 键 ， 但 不 是 键 。 换 铝 
话说 ， 超 键 就 像 一 个 没有 最 小 性 条 件 的 键 。 这 样 ， 我 们 能 得 出 车 属性 集 六 是 超 键 且 它 没有 真 
子 集 也 是 超 键 ， 则 该 属性 集 是 键 。 
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2) 每 个 关系 都 有 键 〈 因 而 也 有 超 键 )。 实 际 上 ， 若 模式 $ 的 合法 实例 中 若 有 两 个 元 组 的 每 
个 属性 值 都 相同 ， 则 由 于 关系 是 集合 而 集合 不 允许 有 相同 的 元 素 , :所 以 这 对 元 组 只 能 是 相同 
的 ， 那么 S 的 所 有 属性 构成 的 集合 必定 是 超 键 。 另 一 方面 ， 若 S 的 所 有 属性 构成 的 集合 不 是 最 
小 的 超 键 ， 则 一 定 会 有 超 键 是 S 的 真子 集 。 若 该 超 键 还 不 是 最 小 的 超 键 ， 那 么 应 该 还 有 更 小 的 
超 键 。 但 一 个 关系 中 属性 的 数目 是 有 限 的 ， 我 们 最 后 一 定 会 达到 这 个 最 小 的 超 键 ， 由 键 的 定 
LYM, C- EER. 

3) 模式 可 以 有 不 同 的 键 。 例 如 ， 在 CouRSE 关 系 中 ，CrsCode 可 以 是 一 个 键 。 但 由 于 同一 
个 系 不 会 开设 同名 的 不 同 课程 ， 我 们 还 可 以 用 {DeptId,，CrsName} 作 为 该 关系 的 键 。 

若 一 个 关系 有 多 个 键 ， 则 它们 都 称 为 候选 键 (candidate key )。 然 而 ， 通 常会 指定 其 中 一 
个 键 作 为 主键 (primary key )。 在 应 用 程序 中 ， 主 键 可 以 有 也 可 以 没有 任何 特定 的 语义 (通常 
选取 相同 候选 键 中 的 第 一 个 作为 主键 )。 然 而 ， 只 要 给 定 主键 值 ， 商 业 的 数据 库 管理 系统 要 使 
用 主键 来 优化 存储 结构 从 而 加 快 数据 访问 ， 所 以 主键 的 选择 会 影响 到 物理 模式 。 

图 4-6 给 出 学 生 注 册 数 据 库 模 式 以 及 包含 的 键 约束 。 注 意 CouRsE 关 系 有 两 个 键 。 


STUDENT(Id:INTEGER，Name:STRING，Addqress:STRING，Status :STRING) 
Key: {Id} 
PROFESSOR (Id:INTEGER, Name: STRING, DeptId:DEPTS) . 
Key: {Id} 
Cours (CrsCode: COURSES, Dept Id: DEPTS, CrsName: STRING, 
Descr: STRING) 


Keys: {CrsCode}, {DeptId,CrsName} 
TRANSCRIPT (StudId: INTEGER, CrsCode:COURSES, Semester: SEMESTERS, 
Grade : GRADES) 
Key: {StudId,CrsCode, Semester} 
TEACHING (ProfId:INTEGER, CrsCode:COURSES, Semester: SEMESTERS) 
Key: {CrsCode,Semester} 





图 4-6 学 生 注册 数据 库 的 键 约束 片断 


2. 参照 完整 性 i - 

在 关系 数据 库 中 ， 一 个 关系 中 的 元 组 会 常常 引用 同一 个 关系 或 其 他 关系 中 的 元 组 。 比 如 ， 
图 4-5 中 TEACHING 关 系 的 第 一 个 元 组 的 属性 ProfID 值 是 009406321， 它 指 到 PRoFESssoR 表 中 的 教 
授 Jacob Taylor 这 个 元 组 ， 访 元 组 Id 字段 的 值 就 是 009406321。 同 样 地 ，TEAcHING 表 的 第 一 个 
元 组 的 值 MGT123 指 到 CouRsE 表 中 包含 的 Market Analysis 课 程 的 元 组 。 

在 许多 情况 下 ， 如 果 被 引用 的 元 组 不 存在 则 数据 完整 性 会 遭 到 破坏 。 比 如 ， 若 CouRsE 关 
系 中 没有 一 个 元 组 描述 MGT123， 则 TEAcHING 关 系 中 拥有 元 组 <009406321,MGT123,F1994> 就 
ELEL TAJ, Jacob Taylor 教 哪 一 门 课 呢 ? 同样 地 ， 若 TeAcHING 关 系 中 没有 Id 为 009406321 
的 元 组 ， 则 也 无 法 确定 哪 位 教授 讲授 Market Analysis 这 门 课 。 

被 引用 的 元 组 必须 存在 (这 是 数据 的 语义 所 需求 的 ) ， 这 种 需求 称 为 参照 完整 性 
(referential integrity) 。 参 照 完 整 性 的 一 个 重要 类 型 是 所 谓 的 外 键 约 束 e。 

假设 S 和 T 是 关系 模式 ， 天 是 S 中 的 属性 列表 ，key( 天 ) 是 T 的 键 约束 。 并 假设 素 和 天 的 属 


O ”请 记 住 参 照 完 整 性 的 概念 比 外 键 约束 的 概念 更 为 通用 。 很 快 我 们 会 介绍 包含 依赖 ， 它 是 另 一 种 参照 完整 性 。 
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性 之 间 存在 一 对 一 的 对 应 关系 (当然 这 些 属性 名 字 不 必 相同 )。 当 且 仅 当 对 于 每 个 元 组 y E s, 
存在 t 中 的 元 组 : E t， 它 在 天 中 属性 上 的 值 和 s 在 到 中 对 应 属性 的 值 相 同 ， 则 关系 实例 s 和 t (分 
别 对 应 模式 S 和 T) 满足 外 键 约束 “S(F) 引 用 T(F)”， 且 是 外 键 (foreign key). 

图 4-7 解 释 了 外 键 约束 的 概念 。 在 图 中 ， 表 T, 的 属性 D 被 声明 为 外 键 ， 它 引用 表 T, 中 的 属 
性 E。E 必 须 是 T, 的 候选 键 或 主键 ， 但 注意 ， 两 个 表 中 引用 和 被 引用 的 属性 (DME) 其 名 字 不 
必 相同 。 还 应 注意 ， 尽 管 Ti 中 的 每 行 都 正好 引用 表 T; 的 某 行 ， 但 不 是 T 中 所 有 的 行 都 必须 被 
引用 ， 并 且 Ti 中 可 以 有 2 行 或 更 多 的 行 引用 T: 的 同一 行 。 











O 图 4-7 表 T, 中 的 属性 D 是 外 键 ， 它 引用 表 T, 中 的 属性 E! 而 E 是 候选 征 
在 下 一 节 ， 我 们 会 介绍 如何 在 SQL 中 定义 外 键 约束 ， 并 讨论 这 种 约 来 的 精 册 请 浆 ( 比 起 


上 面 的 定义 ， 它 的 自由 度 稍 天 一 些 ). 
在 外 键 约束 中 ， 引 用 和 被 引用 的 关系 可 以 是 相同 的 ， 比如 ， 对 于 模式 : 
EMPLOYEE (Id:INTEGER, Name:STRING, MngrId:INTEGER) AN 
该 模式 的 键 是 {Id} 。 主 管 也 是 雇员 ， 故 有 约束 “EMPLOYEE (MngrId) 引用 EMPLOYEE (1d)”。 
该 约束 意味 着 EMPLOYEE 关 系 中 的 每 个 元 组 PE aN<....0.,.0...,998877665>, 属性 MngrId 的 值 
998877665 必 须 出 现在 这 个 关系 的 某 个 元 组 的 但 字段 中 。 
对 应 图 4-6 的 外 键 约束 如 图 4:8 所 示 。 这 里 有 三 点 值得 注意 3 






TRANSCRIPT (StudId) references STUDENT(Id) 
TRANSCRIPT (CrsCode) references Cours (CrsCode) 

-TEACHING(ProfId) references PROFESSOR (Id) 

TEACHING (CrsCode) references COURSE (CrsCode) ; 

TRANSCRIPT (CrsCode,Semester) references TEACHING (CrsCode, Semestep) 





















图 4-8 学 生 注册 系统 的 部 分 外 部 键 约束 


1) 用 于 交叉 引用 关系 的 属性 不 必 有 相同 的 名 字 。 比如 ，TRANSCRIPT 表 的 属性 StuadId3| 
用 STUDENT 表 的 属性 Id， 而 不 是 StiidId 上 上面 所 说 的 EMPLOYEE 关 系 中 外 键 的 情况 也 湛 一 
样 的 。 

2) 外 键 可 能 由 多 个 属性 组 成 ， 如 图 4-8 中 最 后 一 个 约束 所 示 。 浅 显 地 说 ， 该 约束 规定 若 某 
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学 生 在 某 个 学 期 修 某 门 课 ， 那 么 在 该 学 期 必须 有 教授 教 这 门 课 。 
3) 这 一 点 是 微妙 的 。 不 同 于 人 们 普遍 的 想法 ， 教授 不 会 在 没有 学 生 的 班级 里 授课 一 一 至 
少 在 某 些 大 学 里 是 这 样 。 换 名 话说 ， 


TEACHING (CrsCode ,Semester) (4.1) 
references TRANSCRIPT (CrsCode , Semester) i 


也 应 该 是 数据 库 中 的 一 个 约束 ， 即 关系 TEAcHING 中 的 每 一 元 组 的 课程 必须 被 至 少 一 个 学 生 所 
选中 。 因 此 (4.1) 也 是 一 个 参照 完整 性 约束 ,但 它 不 是 外 键 。 因 为 根据 外 键 的 定义 ， 被 引用 的 
属性 集合 必须 是 被 引用 关系 中 的 候选 键 。 

集合 <CrsCode ，Semester> 不 是 关系 TRANSCRIPT 中 的 候选 键 ， 这 是 因为 在 任何 学 期 可 以 有 
多 个 学 生 选 同一 门 课 。 这 个 例子 说 明 ， 和 参照 完整 性 约束 有 时 不 是 外 键 约束 。 

在 数据 库 理 论 中 ， 上 面 的 约束 称 为 包含 依赖 (inclusion dependency )。 外 键 约束 是 一 种 特 
殊 的 包含 依赖 ， 在 该 约束 中 ， 被 引用 的 属性 集 是 一 个 键 。 但 是 ， 由 于 一 般 的 包含 依赖 在 自动 
执行 时 比较 复杂 ， 所 以 在 SQL 的 DDL 中 没有 包括 它们 。 尽 管 如 此 ， 它 们 可 由 SQL 的 断言 机 制 
来 表达 。 本 章 后 面 会 用 CREATE ASSERTION (创建 断言 ) 语句 来 表示 约束 4.1。 

3. 语义 约束 

类 型 、 域 、 键 和 外 键 约束 都 是 结构 化 的 一 一 它们 约束 数据 的 结构 。 还 有 一 些 约束 和 结构 
没什么 关系 ， 但 可 以 实现 某 个 企业 的 业务 规则 或 习惯 。 这 种 约束 是 语义 上 的 ， 这 是 因为 它们 
源 自 被 数据 库 建 模 的 特定 应 用 领域 9 。 

,学 生 注册 系统 中 许多 的 语义 约束 在 第 3 章 已 经 讨论 过 。 比 如 ， 注 册 某 门 课程 的 学 生 人 数 不 
能 超过 该 门 课 的 教室 的 座位 数 ， 学 生 注册 一 门 课 必 须 首先 要 完成 该 课程 的 所 有 预备 课程 ， 等 
等 。 后 面 会 说 明 ，SQL 可 以 为 指定 各 种 语义 约束 提供 支持 。 


4.3 SQL “数据 定义 子 语言 A 


读者 已 经 熟悉 关系 模型 的 基本 概念 (各 表 和 约束 )， 本 节 将 介绍 如 何 利用 SQL 的 数据 定义 
子 语言 指定 “现实 世界 ”中 的 这 些 概念 。 我 们 的 讨论 基于 SQL-92 标 准 ， 但 要 注意 ， 大 多 数 的 
数据 库 厂商 没有 完全 支持 该 标准 。SQL 的 用 户 手册 长 达 几 百 页 (实际 的 标准 有 几 千 页 )， 我 们 
将 只 讨论 该 语言 最 重要 的 部 分 。 若 读者 计划 承担 重要 的 SQL 项 目 ， 应 当 阅 读 厂商 提供 的 参考 
手册 。 
当然 ，SQL-92 是 过 去 的 标准 ， 我 们 还 应 该 了 解 一 下 新 的 标准 。 为 解释 事务 处 理 中 的 一 些 
ee 我 们 也 会 谈 及 SQL:1999。 本 书 的 其 他 部 分 也 会 介绍 SQL:1999 标 准 。9.2 节 将 描述 触 

，16.5 节 将 介绍 对 象 -关系 数据 库 。 一 些 厂商 在 他 们 最 新 版 本 的 数据 库 管 理 系统 中 正 逐 源 

二 1999, 

.模式 用 CREATE TABLE 语 名 说明。 该 语句 语法 丰富 ， 我 们 将 逐步 说 明 这 些 语 法 。 它 的 几 
平 最 短 的 语法 可 以 指定 类 型 约束 : 关系 名 ， 带 有 相关 域 的 属性 名 ; 当然 该 语句 还 可 以 指定 主 
键 、 候 选 键 、 外 键 约束 ， 甚 至 某 个 语义 约束 。 


日 术语 “语义 约束 ” 可 能 有 点 误导 性 ， 有 人 会 说 键 和 外 键 也 应 该 是 语义 约束 ， 因为 它们 也 反映 某 些 业务 规则 。 
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4.3.1 指定 关系 类 型 
STUDENT 关系 的 类 型 可 用 如 下 语句 定义 ”: 


CREATE TABLE STUDENT ( 


Id INTEGER, 
Name CHAR (20) , 
Address CHAR(50), 
“Status CHAR(10) ) 


读者 应 能 很 容易 地 把 该 模式 和 前 面 的 例子 联系 起 来 ， 上 面 我 们 用 黑体 显示 保留 字 ， 使 得 它们 
的 显示 更 为 突出 。 


4.3.2 系统 目录 


当 数 据 库 管理 系统 将 DML 语 句 翻译 成 可 执行 的 程序 时 ， 它 必须 用 一 些 信息 来 描述 数据 库 
的 结构 。 这 些 信 息 保存 在 系统 目录 (system catalog) 中 。 上 面 CREATE TABLE 命 令 的 主要 目 
的 是 定义 一 个 模式 ， 些 外 它 还 把 一 行 描述 创建 表 的 信息 插入 到 系统 目录 中 。 目 录 是 带 有 模式 
的 特殊 关系 的 集合 。 图 4-9 中 的 CoLumNs 表 是 系统 目录 的 一 部 分 ， 该 表 的 每 一 行 包含 数据 库 表 
的 某 个 列 的 信息 ， 这 样 所 有 数据 库 中 所 有 的 列 都 以 这 样 的 方式 来 描述 。 例 如 ， 表 CouRsEs 的 四 
个 列 由 CoruMNs 的 四 行 来 描述 。 


AttrName CHAR(255) 
RelName CHAR (255) 
Position CHAR (255) 
CHAR(255) 
CHAR (6) 

CHAR (4) 

CHAR (20) 

CHAR (100) 
INTEGER 
CHAR (20) 
CHAR (50) 
CHAR (10) 















Columns 













Columns 







Columns 





Format Columns 
CrsCode 
DeptId 


CrsName 









Course 


Course 






Course 





Descr Course 
Student 
Student 
Student 


Student 










Address 
Status 
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图 4-9 目录 关系 


由 于 COLUMNS 也 是 一 个 表 ， 它 的 信息 也 需要 记录 下 来 。 但 我 们 不 需要 单独 创建 表 来 记录 
这 些 信息 ， 而 是 可 以 方便 地 在 CoLuMNs 表 自身 中 来 描述 它 自己 ? .这 样 ，CoLuMmNs 表 的 前 面 儿 
行 描述 该 关系 的 模式 。 例 如 ，CoLuMNs 第 一 行 说 明 它 的 第 一 个 列 其 属性 名 是 AttrName ， 域 是 
CHAR(255). oo 
那么 所 有 这 些 引 用 复杂 性 会 造成 步步为营 吗 ? 读者 无 需 担心 这 个 问题 ， 数 据 库 管理 系统 
的 系统 目录 模式 是 由 厂商 设计 的 ， 当 数据 库 管理 员 初 始 化 一 个 新 的 数据 库 时 ， 目 录 实 例会 自 


日 为 免 混淆 ， 关 系 名 、 属 性 和 类 型 用 不 同 的 字体 。 
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动 生成 。 
43.3 键 约束 


SQL 用 两 种 不 同 的 语句 来 指定 主键 和 候选 键 : PRIMARY KEY 和 UNIQUE。 例 如 ， 
CouRsE 表 的 模式 如 下 所 示 : 


CREATE TABLE COURsE ( 


CrsCode CHAR(6), 

DeptId CHAR(4) ， 

CrsName CHAR (20) , 

Descr CHAR (100) , 
PRIMARY KEY (CrsCode), 

UNIQUE (DeptId,CrsName) ) 


注意 ， 我 们 把 属性 Deptld 的 域内 DEPTS 政 为 CHARC， 把 属性 CrsCode 的 域 从 COURSE 改 为 
CHAR(6)。 不 要 担心 这 个 问题 ， 后 面 我 们 会 解释 如 何 使 用 这 些 不 正式 的 域名 。 临时 改变 的 原 
因 在 于 CHAR 和 INTEGER 是 内 建 的 域 类 型 而 DEPTS 和 CouRsE 是 用 户 自 定义 的 。 后 面 会 解释 在 
SQL 中 如 何 完 成 这 个 操作 。 


43.4 处 理 空 缺 信息 


在 我 们 上 面 定 义 的 关系 中 ， 它 包含 的 每 个 元 组 依次 都 有 已 知 的 值 META 
<111111111,Doe John,123 Main St.,freshman> 中 ， 每 个 属性 如 Id，Name，Address 等 都 有 已 知 
的 值 。 但 在 现实 中 ， 某 个 属性 的 值 可 能 是 未 知 的 。 例 如 当 学 生 Doe John 刚 注册 时 ， 他 的 住址 
可 能 是 不 知道 的 。 学 校 会 要 求 他 尽 可 能 提供 地 址 信息 ， 但 是 如 果 他 没有 这 么 做 也 不 应 当 把 他 
排除 出 数据 库 之 外 ， 而 是 应 该 先 存储 NULL 这 个 占 位 符 到 地 址 属性 上 ， 等 他 确定 地 址 后 ， 再 填 
和 人 地 址 信息 。 类 似 地 ， 当 学 生 注册 某 门 课 程 时 ， 即 使 Grade 属性 没有 特定 的 值 (事实 上 ， 在 学 
期 结束 以 前 不 会 有 成 绩 )， 但 相应 的 元 组 也 能 输入 TRANSCRIPT 关 系 中 。 

NULL 占 位 符 通常 称 之 为 null 值 ， 也 许 这 会 误导 读者 ， 因 为 NULL 不 是 一 个 值 ， 这 里 它 只 
意味 着 这 个 地 方 筷 乏 “正常 ” 值 。 在 数据 库 理论 和 实践 中 ，NULL 被 看 作 是 特殊 的 值 ， 它 可 以 
作为 任何 属性 域 的 一 员 ， 但 又 不 同 于 任何 域 中 的 其 他 值 。 实 际 上 ， 在 第 6 章 我 们 会 发 现 NULL 
甚至 不 等 于 它 自 己 ! 

在 上 面 的 例子 中 ， 由 于 缺乏 信息 而 出 现 null 值 。 在 有 些 情况 下 ， 设 计 中 也 会 带 来 null 值 。 
比如 属性 MaidenName (婚前 名 字 ) 只 适合 女性 而 不 适合 男性 。 数 据 库 设 计 者 可 能 会 用 模式 
EMPLOYEE (Id: INT, Name: STRING, MaidenName: STRING) 来 描述 企业 员工 。 若 这 种 
模式 用 于 男性 雇员 的 话 ， 那么 这 些 元 组 的 MaidenName 属 性 不 会 也 不 应 该 有 任何 值 ， 只 能 用 
null 来 表示 。 
正如 后 面 将 要 介绍 的 那样 ，null 值 经 常 带 来 其 他 的 问题 ， 特别 在 查询 处 理 中 。 由 于 这 样 或 
那样 的 原因 ， 有 时 会 要 求 在 某 些 特殊 的 地 方 不 允许 出 现 null 值 ， 比 如 ， 主 键 中 就 不 允许 出 现 
null 值 。 否 则 ， 我 们 怎么 解释 STUDENT 关系 中 <NULL,Doe John,123 Main St.,freshman> 这 个 元 
组 ?如 果 John Doe 和 他 的 一 个 也 叫 John Doe 的 朋友 共 居 一 屋 ， 而 他 也 是 该 校 大 一 的 新 生 ， 那 
么 如 何 区 分 他 们 两 个 人 呢 ? 
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大 多 数 的 数据 库 管 理 系统 会 拒绝 可 能 使 主键 的 某 个 属性 出 现 null 值 的 更 新 。 除 此 之 外 ， 还 
有 些 地 方 不 适合 使 用 null 值 。 比 如 ， 尽 管 可 以 不 指明 地 址 信息 ， 但 不 输入 学 生 的 名 字 肯 定 会 带 
来 问题 。 

总 之 ， 数 据 库 设 计 者 可 以 用 如 下 方法 处 理 空 值 问 题 ， 就 是 在 那些 对 数据 库 的 语义 完整 性 
至 关 重 要 的 属性 中 不 允许 出 现 null 值 。 比 如 ， 可 像 如 下 的 例子 那样 消除 Name 字 段 的 null 值 : 


CREATE TABLE STUDENT ( 


Id INTEGER, 

Name CHAR(20) NOTNULL, 

Address CHAR(50) , 

Status CHAR(10) DEFAULT 'freshman', 


PRIMARY KEY (Id) ) 

该 例 中 ，null 值 不 能 出 现在 主键 Id (不 必 显 示 地 指明 ) 和 Name 属 性 (我 们 必须 显示 地 说 
WH) 中 。 这 里 还 有 个 特性 需要 注意 ， 用 户 可 以 为 某 个 属性 指明 默认 (Default) 值 。 当 插入 一 
条 新 元 组 且 没 有 给 该 属性 赋值 时 ， 这 个 缺 省 值 会 自动 赋 给 该 属性 。 

4.3.5 语义 约束 

语义 约束 用 CHECK 子 名 说 明 ， 基 本 语法 形式 是 : 

CHECK (条 件 表达 式 ) 

条 件 表达 式 可 以 是 任何 出 现在 SQL 语句 的 WHERE 子 名 中 的 谓词 或 谓词 的 布尔 组 合 。 如 果 
条 件 表 达 式 的 值 是 false， 则 说 明 违 反 完 整 性 约束 。 

CHECK 子 句 不 是 单独 使 用 的 。 它 要 么 附属 在 CREATE TABLE 语 句 中 ， 要 么 附属 在 
CREATE ASSERTION 语 句 中 。 对 于 前 者 ， 它 通常 是 在 关系 上 实现 关系 内 (intra-relational ) 
约束 ; 对 于 后 者 ， 它 通常 实现 关系 间 (inter-relational) 约束 。 

下 面 的 例子 说 明 CHECK 子 句 如 何 限制 属性 的 取 值 范围 


CREATE TABLE TRANSCRIPT ( 
StudId INTEGER, 
CrsCode CHAR(6), 
Semester CHAR(6), (4.2) 
Grade  CHAR(1), l 
CHECK ( Grade IN ('A', 'B', 'C', 'D', 'F') ), 
CHECK: ( StudId > 0 AND StudId < 1000000000 ) ) 


限制 属性 的 取 值 范围 不 仅仅 只 像 上 面 那样 使 用 CHECK 约 束 。 使 用 下 面 所 示 的 关系 模式 ， 我 们 
可 以 表达 “经 理 必须 比 下 属 的 薪水 更 高 ”这 个 约束 : 


CREATE TABLE EMPLOYEE ( 


Id INTEGER, 
Name CHAR (20), 
Salary INTEGER, 


MngrSalary INTEGER, 
CHECK ( MngrSalary > Salary >) 


CREATE TABLE 语 句 中 的 CHECK 子 句 语义 上 要 求 相 应 关系 上 的 每 个 元 组 都 必 须 满足 相应 
CREATE TABLE 语 名 中 的 CHECK 子 句 的 条 件 表 达 式 。 
该 语义 的 重要 推论 是 空 关 系 〈 设 有 任何 元 组 的 关系 ) 总 是 满足 所 有 的 CHECK 约束 ， 这 是 
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由 于 此 时 没有 元 组 可 供 检查 。 这 种 情况 会 导致 其 些 不 可 预料 的 结果 。 考虑 下 面 在 句法 上 都 正 


确 的 模式 定义 : 
CREATE TABLE EMPLOYEE ( 
Id INTEGER, 
Name CHAR(20), 
Salary INTEGER, 
DepartmentId CHAR(4), (43) 
MngrId INTEGER, 


CHECK ( 0 < (SELECT COUNT(*) FROM EMPLOYEE) ), 
CHECK ( (SELECT COUNT(*) FROM MANAGER) 
< (SELECT COUNT(*)FROM EMPLOYEE) ) ) 


两 个 CHECK 子 句 都 涉及 到 计算 关系 中 元 组 的 数目 的 SELECT。 因 此 ， 第 一 个 CHECK 语 名 
大 致 表示 EMPLOYEE 关 系 不 能 是 空 关系 。 然 而 该 约束 尽管 看 起 来 没有 问题 ， 但 对 于 检查 非 空 的 
关系 它 不 会 达到 目标 。 实 际 上 ， 我 们 介绍 过 ， 是 关系 EMPLOYEE 的 每 个 元 组 都 应 该 满足 该 条 件 ， 
而 不 是 关系 本 身 要 满足 该 条 件 。 因 此 ， 如 果 关 系 是 空 的 ， 它 也 满足 每 个 约束 ， 即 使 这 个 
CHECK 想 要 限制 关系 不 能 为 空 ! 

(4.3) 中 的 第 二 个 CHECK 子 句 说 明 使 用 了 关系 间 的 约束 。 先 假定 公司 有 一 张 表 MANAGER， 
其 元 组 存储 公司 每 个 经 理 的 信息 ， 而 该 约束 表明 雇员 必须 比 经 理 多 ， 当 然 要 在 表 EMPLOYEB 不 
为 空 的 条 件 下 。 

除 这 些小 问题 之 外 ， 由 于 在 表 的 定义 中 捆 人 另外 的 表 ， 所 以 第 二 个 约束 看 上 去 不 是 很 直 
观 。 为 克服 这 个 问题 ，SQL-92 提 供 使 用 CHECK 子 名 的 另外 一 个 语句 : CREATE ASSERTION. 
同 表 一 样 ,断言 也 是 数据 库 模式 的 组 件 ， 它 合并 CHECK 子 句 以 对 称 的 关系 给 两 张 表 施加 约束 。 
这 样 ， 上 面 的 两 个 约束 重新 描述 如 下 〈 这 次 它们 是 正确 的 ): 


CREATE ASSERTION THOUSHALTNOTFIREEVERYONE 
CHECK ( 0 < (SELECT COUNT(*) FROM EMPLOYEE) ) 
CREATE ASSERTION WaTCHADMINCOSTS < 
CHECK ( (SELECT COUNT(*) FROM MANAGER) 
< (SELECT COUNT(*) FROM EMPLOYEE) ) ) 


和 表 定 义 中 出 现 的 CHECK 条 件 不 同 ， 整 个 数据 库 的 内 容 都 必须 满足 这 些 CREATE 
ASSERTION 语 句 的 CHECK 条 件 ， 而 不 仅仅 只 是 主 表 的 单条 元 组 满足 条 件 。 这 样 ， 当 且 仅 当 
EMPLOYEE 关 系 中 的 元 组 数目 大 于 0， 数 据 库 满足 上 面 第 一 个 断言 。 类 似 的 ， 只 要 MANAGER 关 
系 的 元 组 数目 比 EMPLOYEE 关 系 的 元 组 数目 少 ， 则 第 二 个 断言 也 满足 。 

再 来 看 一 个 断言 的 例子 。 首 先 假设 有 关 雇 员 和 经 理 的 薪水 信息 存储 在 不 同 的 关系 中 。 关 
于 谁 赚 得 多 的 规则 如 下 面 的 断言 所 示 ， 该 规则 字面 上 意思 是 说 不 会 有 这 样 的 雇员 : 他 有 老板 
但 老板 的 菏 水 却 很 低 。 我 们 假设 MANAGER 关 系 有 属性 Id 和 Salary 。 


CREATE ASSERTION THOUSHALTNoTOUTEARN YouRBoss 
CHECK ( NOT EXISTS 
(SELECT * FROM EMPLOYEE, MANAGER 
WHERE EMPLOYEE.Salary > MANAGER.Salary 
AND EMPLOYEE.Mngrid = MANAGER.Id )) 


现在 的 一 个 有 趣 的 问题 是 ， 如 果 在 指定 THouSHALTNoTFIREEvERYONE 这 个 约束 时 ， 
EMPLOYEE 关 系 是 空 的 会 怎么 样 ? 另 外 ， 在 指定 TaouSHALTNoTOUTEARNYOURBoss 约 束 时 ， 关 
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系 中 已 经 有 一 个 员工 的 收入 超过 老板 ， 又 会 怎么 样 ? 问题 答案 由 SQL-92 标 准 来 回答 。SQL-92 
规定 当 定义 一 个 新 的 约束 时 ， 车 已 有 的 数据 库 不 满足 它 ， 则 该 约束 不 会 被 接受 。 此 时 数据 库 
设计 者 不 得 不 找 出 约束 被 违反 的 原因 ， 然 后 或 改正 约束 或 调整 数据 库 9 。 
最 后 再 来 看 一 个 稍微 复杂 的 例子 。， 它 演示 如 何 使 用 断言 来 说 明 非 外 键 约束 的 包含 依赖 。 
更 明确 点 ， 我们 就 用 (4.1) 中 的 包含 依赖 ， 其 SQL-92 的 断言 语句 如 下 : 
CREATE ASSERTION COURSESSHALLNOTBEEMPTY 
CHECK (NOT EXISTS ( 
SELECT * FROM TEACHING 
WHERE NOT EXISTS ( (44) 
SELECT * FROM TRANSCRIPT 


WHERE Teaching.CrsCode = Transcript .CrsCode 
AND Teaching.Semester = Transcript .Semester) )) 


这 个 CHECK 约 束 表 明 ，TEACHING 关 系 中 不 出 现 这 样 的 元 组 (外 层 NOT EXISTS 语 句 )， 在 
TRANSCRIPT 关 系 中 不 存在 与 之 对 应 的 课程 (内 层 NOT EXISTS 语 句 )。TEACHING 关 系 中 的 元 组 
” 和 TRANSCRIPT 关 系 中 的 元 组 在 它们 的 CrsCode 和 Semester 这 两 个 属性 值 相等 时 就 引用 相同 的 课 
程 ， 这 是 由 最 内 层 的 WHERE 语句 完成 的 。 

不 同 的 断言 需要 不 同 的 维护 代价 (数据 库 管理 系统 检查 断言 是 否 满足 所 需 的 时 间 )。 一 般 

来 说 ， 关 系 内 约束 的 代价 比 关 系 间 约束 的 代价 低 。 在 所 有 关系 间 的 约束 中 ， 基 于 键 的 约束 比 
那些 不 是 基于 键 的 约束 更 容易 执行 。 因 此 ， 外 键 约束 的 代价 要 比 一 般 的 包含 依赖 的 代价 (如 
4.4) 低 。 . 
由 数据 库 管理 系统 完成 完整 性 约束 的 自动 检查 是 SQL 的 强大 特性 之 一 。 它 不 仅 可 以 保护 
数据 库 免 受 不 可 信用 户 或 粗心 的 程序 员 的 错误 造成 的 危害 ， 而 且 能 简化 对 数据 库 的 访问 。 比 
如 ， 主 键 约束 保证 一 个 表 中 最 多 只 能 有 一 个 元 组 包含 特定 的 主键 值 。 如 果 数 据 库 管理 系统 不 
为 该 约 东 提供 自动 检查 ， 那么 应 用 程序 若 要 插入 一 个 新 的 元 组 或 更 新 已 有 的 某 个 元 组 的 键 属 
性 ， 那 也 不 得 不 从 表 头 开始 扫描 一 遍 来 保证 没有 违反 主键 约束 。 


4.3.6 用 户 自 定义 域 


前 面 我 们 看 到 ， 在 创建 表 时 可 由 CHECK 子 名 限定 属性 的 取 值 范围 。SQL-92 还 提供 另外 一 
种 手段 来 执行 这 种 约束 ， 即 允许 用 户 定义 合适 的 值 范围 ， 并 赋予 它们 域名 ， 然 后 就 可 以 在 表 
定义 中 使 用 它们 。 例 如 ， 我 们 可 以 创建 GRADES 域 ， 并 取代 CHECK 约 束 用 在 TRANSCRIPT 关 系 
的 定义 中 。 

CREATE DOMAIN GRADES CHAR(1) 

CHECK ( VALUE IN ('A', 'B', 'C', 'D', 'F', 'I') ) 

它 和 (4.2) 中 的 约束 的 唯一 不 同 在 于 后 者 直接 施加 约束 于 STUDENT 关系 的 Grade 属性 上 ， 而 这 里 
用 VALUE 这 个 保留 字 而 不 是 属性 名 (不 能 用 属性 的 原因 是 域 不 隶属 于 任何 具体 的 表 )。 现 在 
我 们 就 可 以 添加 l s 


Grade GRADES 


O ”但 是 , 许多 DBMS 广 商 没 有 遵守 该 规定 ， 当 存在 的 数据 和 新 指定 的 约束 冲突 时 ， 它 们 不 会 给 出 警告 。 
O 这 里 牵涉 到 傣 套 和 关联 的 子 查询 。 若 读者 不 理解 (4.4)， 请 在 读 完 第 6 章 后 再 回 到 此 处 。 
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到 STUDENT 的 定义 中 去 。 使 用 用 户 自 定义 域 的 总 体 效 果 是 一 样 的 ， 但 我 们 无 须 重复 定义 就 能 在 
许多 表 中 使 用 这 个 预定 义 的 域名 。 而 且 ， 若 以 后 我 们 修改 域 的 定义 ， 则 这 个 改变 会 自动 传播 
到 所 有 使 用 该 域 的 表 中 。 域 同 表 或 断言 一 样 ， 都 是 数据 库 模式 的 一 个 组 件 。 
请 注意 ， 和 断言 一 起 ， 我 们 可 使 用 复杂 的 查询 定义 复杂 的 域 : 
CREATE DOMAIN UPPERDIVISIONSTUDENT INTEGER’ 
CHECK ( VALUE IN (SELECT Id FROM STUDENT 


WHERE Status IN ('senior', 'junior') 
AND VALUE IS NOT NULL ) 


这 里 ， 域 UPPERDIVISIONSTUDENT 由 Status 是 senior 或 janior 的 所 有 学 生 的 1d 组 成 。 而 且 ， 最 后 
的 子 句 从 域 中 排除 NULL 值 。 注 意 观 察 ， 为 验证 施加 到 该 域 的 约束 是 否 满足 ， 执 行 针 对 该 数 
据 库 的 一 个 查询 。 由 于 这 样 的 查询 代价 可 能 是 很 大 的 ， 所 以 不 是 每 个 厂商 都 支持 这 种 “虚拟 ” 
的 域 。 


43.7 外 键 约束 


SQL 用 简单 且 自 然 的 方式 来 指定 外 键 。 下 面 的 语句 让 Proffd 和 CrsCode 成 为 外 键 ， 分 别 引 
用 PROFESSOR 关 系 和 COURSE 关 系 : 


CREATE TABLE TEACHING ( 
ProfId INTEGER, 
CrsCode CHAR(6), 
Semester CHAR(6), 
PRIMARY KEY (CrsCode, Semester), 
FOREIGN KEY (CrsCode) REFERENCES COURSE, 
FOREIGN KEY (ProfId) REFERENCES PROFESSOR (Id) ) 


车 引用 和 被 引用 的 属性 名 字 相 同 ， 那 么 被 引用 的 属性 可 以 省 略 。 上 例 中 的 CrsCode 就 是 这 
种 情形 。 若 被 引用 的 属性 名 字 不 同 于 引用 属性 ， 那 么 两 个 属性 的 名 字 都 应 该 指明 。 上 面 第 二 
个 FOREIGN KEY 子 句 的 PROFESSOR(Id) 部 分 显示 了 这 种 情况 。 

应 当 注 意 的 是 ， 尽 管 SQL 标 准 没 有 要 求 被 引用 的 属性 必须 是 主键 (当然 也 可 以 是 任何 候 
选 键 )， 一 些 数据 库 厂 商 却 会 强加 主键 这 个 限制 。 

在 上 面 的 例子 中 ， 无 论 何 时 TEACHING 关 系 中 拥有 一 个 课程 代码 ， 则 对 应 该 代码 的 课程 记 
录 一 定 存在 于 CoURsE 关 系 中 。 类 似 的 ，TeAcHING 关 系 中 教授 的 Id 也 必须 引用 PRoFESSoR 关 系 中 
已 有 的 元 组 。 一 旦 指定 这 些 约束 ， 数 据 库 管 理 系 统 会 保证 自动 执行 这 些 约束 。 因 此 ， 如 果 某 
个 过 程 删除 PROFESSoR 关 系 中 的 一 个 元 组 ， 数 据 库 管理 系统 将 自动 检查 以 保证 TEAcHING 关 系 中 
没有 相应 的 元 组 。 | 

考虑 我 们 讨论 过 的 空 值 现象 ， 可 列 出 下 列 的 问题 : 若 某 个 元 组 其 外 键 中 的 某 个 属性 值 是 
NULL, PRELE? 是 不 是 我 们 也 应 该 让 被 引用 的 关系 中 相应 的 元 组 中 其 键 属 性 值 也 为 
NULL? 这 不 是 一 个 好 的 想法 ， 特 别 是 当 被 引用 的 键 是 主键 时 ， 这 种 想法 的 缺点 更 为 明显 。 因 
此 ，SQL 放 宽 外 键 约束 的 要 求 ， 让 外 键 可 有 null 值 。 在 这 种 情况 下 ， 被 引用 的 关系 中 就 不 需要 
有 对 应 的 元 组 。 

外 键 约束 引发 许多 有 趣 的 问题 。 考 虑 (4.3) 中 定义 的 表 EMPLOYEE， 假 设 我 们 还 有 一 个 表 描 
述 部 门 的 信息 : 
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CREATE TABLE DEPARTMENT ( 
DeptId CHAR(4), 
Name CHAR (40) 
Budget INTEGER, 
MngrId INTEGER, 
FOREIGN KEY (MngrId) REFERENCES EMPLOYEE (Id) ) 


现在 ,我 们 回头 看 EMPLOYEE 表 中 的 DepartmentId 属 性 ， 很 明显 ， 该 属性 应 当 描 绘 一 个 合 
法 的 部 门 14 (也 就 是 说 ， 部 门 的 1d 要 存储 于 DEPARTMENT 关 系 中 )。 换 旬 话 说 ， 在 EMPLOYEE 关 系 
的 创建 语句 中 会 有 如 下 的 语句 : 

FOREIGN KEY (Departmentid) REFERENCES DEPARTMENT (DeptId) 

现在 问题 在 于 ，EMPLOYEE 和 DEPARTMENT 表 总 有 一 个 会 首先 定义 。 若 EMPLOYEE 先 定义 ， 由 
于 它 引 用 尚未 定义 的 表 DEPARTMENT， 所 以 我 们 不 能 在 CREATE TABLE EMPLoYEE 语 句 中 拥有 
土 面 的 外 键 约 束 。 若 关系 DEPARTMENT 先 定 义 ， 在 语 名 CREATE TABLE DEPARTMENT 中 试图 处 
理 外 键 约束 时 数据 库 管理 系统 将 发 出 错误 警告 ， 这 是 因为 该 外 键 约束 引用 还 未 创建 的 表 
EMPLOYEE。 这 里 我 们 碰 到 了 鸡 生 蛋 还 是 蛋 生 鸡 的 问题 。 

解决 问题 的 办 法 是 推迟 在 第 一 个 表 中 引入 外 键 约束 。 也 就 是 说 ， 如 果 先 执行 CREATE 
TABLE EMPLOYEE， 则 不 应 该 包含 FOREIGN KEY 子 句 。 在 CREATE TABLE DEPARTMENT 语句 
处 理 完 之 后 ， 再 使 用 ALTER TABLE 指令 加 入 我 们 需要 的 约束 。 后 面 的 小 节 中 将 详细 描述 该 
指令 。 这 里 只 给 出 最 终 的 结果 : 


ALTER TABLE EMPLOYEE 
ADD CONSTRAINT EMPDEPTCONSTR 
FOREIGN KEY (DepartmentId) REFERENCES DEPARTMENT (DeptId) 


在 解决 了 这 个 循环 引用 问题 后 ， 我 们 来 给 数据 库 装 和 人 数据， 此 时 读者 将 磁 到 另 一 件 奇怪 
的 事情 。 假 定 我 们 把 数据 <000000007, James Bond, 7000000, B007, 000000000> 放 入 到 
EMPLoYEE 的 第 一 个 元 组 上 ， 而 此 时 由 于 DEPARTMENT 表 还 是 空 的 ， 所 以 规定 B007 应 当 引 用 
DEPARTMENT 表 的 一 个 合法 元 组 的 外 键 约束 被 违反 。 

一 个 解决 办 法 是 开始 时 将 关系 EMPLOYEE 的 所 有 元 组 其 DepartmentId 属 性 都 先 赋 给 NULL 
值 ， 然 后 当 给 DEPARTMENT 关 系 填充 完 合 适 的 数据 后 ， 我 们 再 扫描 EMPLOYEE 表 并 用 合法 的 
DepartmentId 值 替换 NULL 值 。 但 是 这 种 方法 很 笨拙 ， 且 容易 出 错 。 更 好 的 解决 办 法 是 使 用 事 
务 ， 并 推迟 检查 完整 性 约束 。 

在 第 2 章 中 我 们 曾 指出 ， 事 务 会 产生 数据 库 的 某 个 中 间 状 态 ， 这 可 能 会 造成 不 一 致 性 ， 即 
暂时 地 违反 完整 性 约束 。 当 事务 提交 后 ， 约 束 必须 被 保留 。 为 适应 暂时 性 的 约束 违反 ，SQL 
允许 程序 员 指 定 某 个 完整 性 约束 的 模式 是 IMMEDIATE (立即 的 ) 或 是 DEFERRED (推迟 的 )。 
在 IMMEDIATE 模 式 下 ， 每 当 执行 一 个 SQL 语句 改变 数据 库 时 ， 就 要 立即 执行 完整 性 检查 ; 在 
DEFERRED 的 模式 下 ， 只 在 事务 被 提交 时 才 做 完整 性 检查 。 为 解决 循环 引用 这 个 问题 ， 我 们 
可 以 利用 以 下 方法 : 

1) 在 表 EMpLovyEE 和 DEPARTMENT 中 将 外 键 约束 初始 模式 声明 为 DEFERREPD。 

2) 让 写 人 数据 到 表 的 这 些 更 新 操作 在 同一 个 事务 中 。 

3) 保证 当 所 有 更 新 完成 时 外 键 约束 得 到 满足 ， 否 则 事务 结束 时 会 异常 中 止 。 

有 关 在 SQL 中 如 何 定义 事务 以 及 它 和 约束 的 相互 作用 会 在 第 10 章 中 详细 介绍 。 
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43.8 反应 性 约束 

一 般 来 说 ， 当 约束 被 违反 时 ， 相 应 的 事务 会 异常 中 止 。 然 而 在 某 些 情况 下 应 该 采取 补救 
措施 。 外 键 约束 就 是 这 样 的 例子 。 

假设 元 组 <007007007, MGT123, F1994> 要 插入 到 关系 TEACHING 中 ， 由 于 表 PROFESSOR 中 没 
有 一 条 记录 其 Id 是 007007007， 所 以 该 插入 操作 将 违反 外 键 约束 ( 它 要 求 TEACHING 中 的 ProfIld 
字段 的 所 有 非 空 值 都 应 当 引 用 到 现 有 的 教授 )。 在 这 种 情况 下 ，SQL 的 语义 很 简单 : 插入 操作 
被 拒绝 。 

对 于 因 删 除 一 条 被 引用 元 组 而 违反 约束 的 情况 ，SQL 通 常 提 供 更 多 的 处 理 手段 。 考 虑 表 
TEACHING 中 的 元 组 : = <009406321, MGT123, F1994> ， 根 据 图 4-5 得 知 ，1 引 用 PROFESSOR 关 系 
中 的 Taylor 教 授 以 及 CoURSE 关 系 中 的 Market Analysis 课 程 。 假 设 由 于 教学 任务 过 于 繁重 ， 
Taylor 教 授 没 能 发 表 足 够 的 论文 被 辞退 只 好 离开 学 校 。 此 时 1 会 怎么 样 ? 一 个 解决 办 法 是 临时 
将 中 的 ProfId 值 设 为 NULL 直 到 找到 一 位 新 讲师 为 止 。 另 一 个 办 法 是 设法 把 Taylor 教 授 的 元 组 
从 表 PRoFESSOR 中 删除 ， 但 删除 失败 〈 所 以 不 删除 ) ， 失 败 可 能 缘 于 不 允许 教授 在 学 期 中 途 离 
开 。 最 后 ， 若 Taylor 教 授 是 唯一 有 能 力 讲授 该 门 课 的 老师 ， 我们 可 从 课程 表 中 把 MGT123 删 除 。 
这 样 通过 删除 引用 元 组 :， 违 反 参 照 完 整 性 的 问题 得 到 解决 。 

这 些 可 能 性 可 以 使 用 反应 性 约束 (reactive constraint) 来 描述 。 它 是 一 种 静态 约束 ， 需要 
再 加 上 当 某 事件 发 生 时 该 做 什么 的 规定 。 比 如 上 面 的 第 一 种 方法 的 约束 要 求 无 论 何 时 删除 一 
个 PROFESSOR 元 组 ， 则 TEACHING 表 中 引用 到 它 的 所 有 元 组 的 ProfId 字 段 必须 设 为 NULL。 第 二 
种 解决 方法 的 约束 断言 若 引 用 元 组 存在 ， 则 被 引用 的 元 组 不 能 被 删除 。 第 三 种 解决 办 法 断言 
当 被 引用 的 元 组 被 删除 时 ， 所 有 引用 到 它 的 元 组 都 应 该 被 删除 。 

响应 这 些 事件 要 用 到 触发 器 (trigger)， 触 发 器 语句 的 形式 如 下 : 

WHENEVER event DO action 

SQL-92 只 支持 在 外 键 约 束 中 加 入 非常 简单 的 触发 器 。 实 际 上 ，SQL-92 甚 至 不 提 到 触发 器 
这 个 名 字 。 做 法 是 在 FOREIGN KEY 子 句 中 增加 ON DELETE 和 ON UPDPATE 选 项 ， 这 些 选 项 
指明 若 删除 或 更 新 被 引用 的 元 组 时 引用 元 组 该 怎么 做 。 为 解释 这 个 问题 ， 我 们 再 看 一 下 
TEACHING 表 的 定义 : 


CREATE TABLE TEACHING ( 

ProfId INTEGER, 

CrsCode CHAR(6), 

Semester CHAR(6), 

PRIMARY KEY (CrsCode, Semester), 

FOREIGN KEY (ProfId) REFERENCES PROFESSOR (Id) 
ON DELETE NO ACTION 
ON UPDATE CASCADE, 

FOREIGN KEY (CrsCode) REFERENCES Course (CrsCode) 
ON DELETE SET NULL 
ON UPDATE CASCADE ) 


上 面 我 们 指定 四 个 触发 器 ， 分 别 在 PRoFEssog 元 组 被 删除 、 被 修改 ， 当 CoUuRSE 元 组 被 删除 、 被 
修改 时 ， 触 发 (fired， 即 执行 )。 子 句 ON DELETE NO ACTION 意 味 着 若 PRorEssoR 表 的 某 个 
教授 被 TEAcHING 中 某 个 元 组 所 引用 ， 则 任何 试图 删除 该 教授 的 操作 都 会 被 立即 拒绝 。 当 没有 
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指明 ON DELETE 或 ON UPDATE), MNO _ ACTION 是 缺 省 的 操作 。 子 句 ON UPDATE 
CASCASE 意 味 着 如 果 PRoFESSOR 表 中 的 某 个 元 组 的 Id 字段 值 被 修改 ， 那 么 该 修改 必须 被 传播 
到 TEAcHrNG 关 系 中 引用 它 的 所 有 元 组 中 〈 也 就 是 说 ， 引 用 元 组 要 存储 这 个 新 的 Id 值 ) 。 这 样 ， 
教 课 的 教授 信息 被 正确 记录 下 来 。( 类 似 的 ，ON DELETE CASCADE 子 句 则 要 求 引用 元 组 都 
应 该 被 删除 )。ON DELETE SET NULL 告 诉 数据 库 管 理 系统 ， 当 一 个 CouRsE 元 组 被 删除 且 
TEACHING 表 中 有 元 组 引用 它 ， 那 么 引用 属性 CrsCode 必 须 被 设置 为 NULL 值 。 另 外 ， 数 据 库 设 
计 者 可 以 指定 SET DEFAULT 来 取代 SET NULL， 这 音 味 着 如 果 定 义 CrsCode 有 DEFAULT 选 项 
(比如 前 面 SrupENT 关 系 中 的 Status 属 性 ) ， 那 么 当 被 引用 的 元 组 被 删除 时 ，CrsCode 属 性 要 被 
设置 成 它 的 默认 值 ; 如 果 CrsCode 设 有 DEFAULT 选 项 ， 则 它 被 设置 为 NULL 值 (当然 ，NULL 
值 也 是 DEFAULT 选 项 的 默认 值 )。 

DELETES UPDATE fith & 2% FINO ACTION. CASCADERSET NULLADEFAULTI 选 项 的 任 
意 组 合 都 可 在 外 键 的 触发 器 中 使 用 。 即 使 这 样 ， 它 也 没有 强大 到 满足 数据 库 应 用 程序 带 来 的 
各 种 各 样 约束 的 要 求 。 在 (4.1) 中 我 们 曾 见 过 一 个 非 外 键 约束 的 参照 完整 性 约束 ， 它 就 没有 办 
法 用 DELETE 或 UPDATE 触 发 器 实现 。 更 重要 的 是 ， 外 键 触发 器 其 至 不 能 解决 一 些 普通 的 需求 
(比如 在 事务 中 阻止 薪水 的 变化 幅度 超过 5%)。 

为 处 理 这 些 问 题 ， 主 要 的 数据 库 厂商 都 在 他 们 的 产品 中 提供 触发 器 机 制 ， 作 为 产品 竞争 
的 筹码 。 有 趣 的 是 ， 在 成 为 标准 之 前 ，SQL 中 的 确 是 提供 相关 的 功能 强大 的 触发 器 的 ， 但 只 
到 SQL:1999 才 加 入 触发 器 从 而 形成 比较 完整 的 标准 。 下 面 我 们 只 简要 地 描述 一 般 的 触发 器 机 
制 ， 更 多 的 细节 留 到 第 9 章 再 进行 介绍 。 

触发 器 的 基本 思想 是 很 简单 的 : 只 要 发 生 一 个 特定 事件 ， 就 执行 某 些 特定 的 动作 。 考 虑 
下 面 在 SQL:1999 中 定义 的 一 个 简单 的 触发 器 。 只 要 TRANSCRIPT 表 中 的 元 组 CrsCode 或 Semester 
属性 值 发 生 改 变 ， 读 触发 器 就 会 触发 。 当 触发 器 触发 ， 且 记录 的 该 课程 的 成 绩 不 是 NULL， 则 
出 现 一 个 异常 。 否 则 ， 若 该 成 绩 是 NULL， 我 们 就 把 这 个 改变 看 作 是 学 生 退出 这 门 课 ， 因 此 触 
发 器 什么 都 不 做 ， 而 这 个 改变 也 被 保留 。 触 发 器 的 创建 语句 如 下 : 

CREATE TRIGGER CRSCHANGETRIGGER 

AFTER UPDATE OF CrsCode, Semester ON TRANSCRIPT 


WHEN ( Grade IS NOT NULL ) 
abortit('666', 'Grade must be NULL when registering‘) 


除了 WHEN 子 名 以外， 该 定义 是 很 容易 理解 的 。WHEN 子 句 起 保护 的 作用 ， 也 就 是 说 ， 为 让 
触发 器 执行 ， 必 须 满足 这 个 前 提 条 件 。 如 果 该 前 提 条 件 为 真 ，WHEN 后 面 的 语句 会 被 执行 。 
在 上 面 的 例子 中 ,语句 调用 一 个 用 户 自 定义 的 过 程 abortit( )， 并 以 错误 码 666 和 消 ，, 和 文本 作为 
参数 。 在 abortit( ) 过 程 中 ， 当 检查 到 这 个 错误 码 时 ， 它 可 能 就 中 目 事 务 。 

一 般 而 言 ， 在 定义 触发 器 时 还 应 该 说 明 更 多 的 细节 。 比 如 ， 动 作 执行 应 该 发 生 在 触发 更 新 
施加 于 数据 库 之 前 还 是 之 后 ? 在 事件 发 生 之 后 这 个 动作 是 要 立即 执行 还 是 过 一 段 时 间 再 执行 ? 
触发 器 动作 能 触发 另外 的 动作 吗 ? 而 且 ， 为 在 WHEN 子 句 中 指定 保护 ， 我 们 可 能 需要 引用 被 修 
改 的 元 组 的 新 值 和 虽 值 (比如 ， 检 查 薪 水 的 修改 幅度 是 否 超过 5% )。 这 些 问题 将 在 第 9 章 中 讨 
论 ， 该 章 将 会 说 明 更 多 的 触发 器 的 例子 。 我 们 还 会 特别 说 明 当 面临 更 新 时 如 何 使 用 一 般 的 触发 
器 来 维护 包含 依赖 (类似 于 在 维护 外 键 约束 时 使 用 的 ON DELETE 和 ON UPDATE). 
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4.3.9 数据 库 视图 


在 4.1 节 中 ， 我 们 曾 讨论 过 数据 库 的 三 层 抽象 :物理 层 、 概 念 层 和 外 部 层 。 上 面 我 们 已 介 
绍 过 在 SQL 中 如 何 定义 概念 层 。 本 节 我 们 将 讨论 SQL 的 外 部 层 (或 视图 )。 物 理 层 将 在 第 11 章 


中 讨论 。 
在 SQL 中 ， 外 部 模式 用 CREATE VIEW 语句 定义 。 在 许多 方面 ， 视 图 很 像 一 个 普通 的 表 : 
用 户 可 以 查询 它 ， 修 改 它 ， 控 制 对 它 的 访问 。 然 而 ， 视 图 有 几 个 重要 的 方面 是 不 同 于 表 的 。 


首先 ， 视 图 的 行 来 自 数 据 库 的 表 (和 其 他 视图 )。 因 此 ， 视 图 是 将 存放 在 别处 的 信息 进行 的 再 
包装 。 其 次 ， 视 图 的 内 容 不 是 物理 上 存储 于 数据 库 中 的 ， 如 何 从 数据 库 表 中 构造 视图 的 定义 
存储 于 系统 目录 中 。 很 快 我 们 就 会 看 到 ， 视 图 的 定义 是 CREATE TABLE 语 句 和 第 2 章 中 介绍 
过 的 SELECT 语句 的 混合 体 。 由 于 这 些 原因 ， 视 图 有 时 也 称 为 虚拟 表 (virtual table). 

为 解释 这 个 问题 ， 我 们 考虑 下 面 的 视图 ， 该 视图 用 来 说 明 哪些 教授 教 哪 些 学 生 (“教授 教 
一 个 学 生 ” 的 含义 是 该 学 生 在 某 学 期 选修 该 教授 开 的 课 )。 

CREATE VIEW PROFSTUD (Prof, Stud) AS 

SELECT TEACHING.ProfId, TRANSCRIPT.StudId 

FROM TRANSCRIPT, TEACHING 


WHERE TRANSCRIPT.CrsCode = TEACHING.CrsCode 
AND TRANSCRIPT.Semester = TEACHING.Semester 


上 面 第 一 行 定 义 视 图 的 名 字 和 它 的 属性 ， 随 后 的 语句 就 是 用 来 定义 视图 的 内 容 的 SQL 查询 。 
和 图 4-5 的 数据 库 实 例 有 关 的 视图 内 容 如 图 4-10 所 示 。 为 方便 读者 理解 该 视图 中 的 元 组 都 来 自 
哪里 ， 每 个 元 组 都 用 justification (理由 ) 加 以 注释 (一 条 针对 <P, 5> 的 理由 是 课程 代码 和 学 
期 对 组 成 的 ， 表 示 在 该 学 期 学 生 5 选 修 教授 P 开 设 这 门 课 )。 


PROFSTUD | Prof Stud ` ; | Justification | 


009406321 666666666 MGT123 , F1994 
121232343 | 666666666 EE101 ,S1991 
900120450 666666666 MAT123,F1997 
555666777. 987654321 CS305 ,F1995 
009406321 987654321 MGT123 ,F1994 
101202303 123454321 CS315,S1997; CS305,S1996 
900120450 123454321 MAT123 ,S1996 
121232343 023456789 EE101,F1995 
101202303 | 023456789 C5305 ,S1996 
900120450 111111111 MAT123,F1997 
009406321 111111111 MGT123,F1997 
783432188 111111111 MGT123,F1997 


(4.5) 





图 4-10 由 SQL 语 包 (4.5) 定 义 的 视图 内 容 


PRorSTup 是 外 部 模式 的 一 部 分 ， 它 有 助 于 大 学 和 它 的 毕业 生 保持 联系 。 通 过 课程 建立 学 
生 和 教授 之 间 的 联系 可 能 是 应 用 中 十 分 重要 且 很 常见 的 操作 。 因 此 ， 以 视图 的 形式 一 次 性 地 
把 这 种 联系 确定 下 来 ， 就 不 必 在 每 个 应 用 程序 中 都 要 定义 读 联 系 。 一 旦 以 视图 的 形式 定义 好 
这 种 联系 ， 所 有 的 应 用 程序 都 能 引用 该 视图 ， 就 好 像 它 是 一 张 普通 的 表 。 视 图 的 行 在 它 被 访 
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问 的 时 候 构建 。 

第 6 章 中 ， 我 们 会 详 述 视图 机 制 ， 解 释 如 何 用 视图 将 复杂 查询 的 构造 模块 化 。 授 权 机 制 是 
视图 的 另 一 个 重要 内 容 。 在 本 章 后 面 ， 我 们 将 说 明 为 授权 访问 存储 在 视图 中 的 信息 ， 可 像 普 
通 表 一 样 对 待 视图 。 


43.10 修改 已 有 的 定义 


尽管 从 理论 上 说 ,创建 好 特定 应 用 的 数据 库 模 式 后 不 应 该 再 修改 它 ， 但 在 实践 中 ， 模 式 
有 时 的 确 是 会 变化 的 ， 比 如 增加 一 些 字段 或 删除 一 些 已 有 的 字段 ， 创 建新 的 约束 或 域 ， 而 旧 
的 约束 或 域 可 能 无 效 (也 许 是 因为 业务 规则 发 生 改 变 )。 当 然 ， 我 们 总 可 以 把 旧 模 式 的 内 容 拷 
贝 到 一 个 临时 的 关系 中 ， 删 除 旧 的 关系 和 它 的 模式 ， 然 后 再 用 原来 的 名 字 创 建新 的 关系 模式 。 
然而 ， 这 种 方法 十 分 令 人 达 味 且 容易 出 错 。 为 简化 模式 的 维护 任务 ，SQL 提 供 了 ALERT 语 句 ， 
其 最 简单 的 形式 如 下 所 示 : 


ALTER TABLE STUDENT 
ADD COLUMN Gpa INTEGER DEFAULT 0 


该 命令 在 STUDENT 关系 中 加 入 新 的 字段 ， 并 且 将 每 个 元 组 中 该 字段 的 值 初 始 化 为 0。 另 外 ， 读 
者 还 可 以 使 用 DROP COLUMN 语 句 从 关系 中 删除 一 列 ， 还 可 以 增加 或 删除 约束 。 例 如 : ， 


ALTER TABLE STUDENT 

ADD CONSTRAINT GPARANGE CHECK (Gpa >= 0 AND Gpa <= 4) 
ALTER TABLE TEACHING 

ADD CONSTRAINT TEACHKEY UNIQUE(ProfId, Semester, Time) 


注意 ,如 果 已 有 的 STUDENT 实例 违反 这 个 新 的 GPARANGE 约 束 , BKTEACHING TH JR TEACHKEY 2) , 
则 约束 的 增加 操作 会 遭 到 拒绝 。 
要 从 一 个 表 定 义 中 删除 一 个 约束 ， 则 必须 给 约束 命名 (我们 至 今 未 用 到 过 该 选项 ) 。 下 
面 是 修改 过 的 TRANSCRIPT 关 系 的 定义 ， 其 中 每 个 约束 都 已 命名 : 
CREATE TABLE TRANSCRIPT ( 
StudId INTEGER, 
CrsCode CHAR(6) , 
Semester CHAR(6), 
Grade GRADES, 
CONSTRAINT TRKEY PRIMARY KEY (StudId, CrsCode, Semester), 
CONSTRAINT StupFK FOREIGN KEY (StudId) REFERENCES STUDENT, 
CONSTRAINT CrsFK FOREIGN KEY (CrsCode) REFERENCES COURSE, 


CONSTRAINT IDRANGE CHECK ( StudId > 0 AND 
StudId < 1000000000 )) 


现在 ， 我 们 可 以 删除 任 一 个 指定 的 完整 性 约束 ， 例 如 : 


ALTER TABLE - TRANSCRIPT 
DROP CONSTRAINT TrKEY 


当 不 再 需要 一 个 表 时 ， 可 以 把 它 的 定义 从 系统 目录 中 删除 。 此 时 ， 表 的 模式 和 它 所 有 的 
实例 都 会 丢失 。 以 前 定义 过 的 断言 和 域 也 都 被 删除 。 例 如 : 


日 。、 显 式 命名 约束 是 可 选 的 ， 后面 我 们 会 看 到 给 约束 命名 的 其 他 优势 。 
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DROP TABLE EMPLOYEE RESTRICT 
DROP ASSERTION THOUSHALTNOTFIREEVERYONE 
DROP DOMAIN GRADES l 


DROP TABLE 命 令 有 两 个 选项 : RESTRICT 和 CASCADE。RESTRICT 选 项 表示 车 在 别 
的 定义 (如 完整 性 约束 ) 中 用 到 该 表 ， 则 删除 表 的 操作 会 被 拒绝 。 在 本 例 中 ， 约 束 
THouUSHALTNOTEFIREEvERYONE 防 止 我 们 删除 表 EMPLOYEE。CASCADE 选 项 则 相反 ， 它 表示 不 
仅 删 除 该 表 定 义 还 删除 其 他 所 有 用 到 该 表 的 那些 定义 。 所 以 ， 如 果 我 们 在 上 面 的 DROP 
TABLE 命 令 中 使 用 CASCADE 选 项 ， 则 断言 TiouSHALTNOTEFIREEVERYONE 也 会 被 删除 ( 表 
EMPLOYEE 和 约束 WATCHADMINCOSTS 也 会 被 删除 ) ， 这 样 ， 我 们 也 不 需要 单独 的 DROP 
ASSERTION 语 句 。 

DROP DOMAIN 有 些微 妙 之 处 。 比 如 ， 上 面 的 例子 删除 域 GRADES 不 会 导致 关系 
TRANSCRIPT 的 属性 Grade 不 稳定 。 实 际 上 ， 其 效果 就 如 同 GRADES 的 定义 首先 被 拷贝 到 所 有 表 中 
用 到 它 的 地 方 ， 在 DROP DOMAIN 之 后 该 定义 才 从 系统 目录 中 删 去 。 


4.3.11 SQL- 模 式 


数据 库 的 结构 由 目录 描述 。 目 录 的 成 员 是 表 和 域 这 样 的 模式 对 象 。 因 此 ， 图 4-9 是 学 生 注 
册 系 统 目录 的 简化 版 本 。SQL-92 人 允许 目录 分 割 为 SQL- 模 式 。SQL- 模 式 (SQL-schema) 是 
一 部 分 数据 库 的 描述 ， 该 数据 库 由 某 位 用 户 控制 ， 而 该 用 户 有 权 创 建 和 访问 数据 库 中 的 对 象 。 
例如 ， 语 句 

CREATE SCHEMA SRS_STUDINFO AUTHORIZATION JohnDoe 
创建 SRS_STUDINFo 这 个 SQL- 模 式 ， 它 描述 包含 学 生 信息 的 部 分 学 生 注 册 系 统 数据 库 。 
AUTHORIZATION 子 句 指定 用 户 JohnDoe 可 访问 在 该 SQL- 模 式 中 定义 的 表 和 其 他 对 象 。 
JohnDoe 称 为 该 SQL- 模 式 的 授权 1d (authorization Id)。 一 般 的 做 法 是 把 同一 个 授权 Id 赎 给 几 个 
不 同 的 用 户 账户 。 

SQL -模式 的 命名 机 制 类 似 于 操作 系统 中 的 目录 结构 。 例 如 ， 如 果 JohnDoe 想 在 SQL- 模 式 
SRS_STUDINFo 中 创建 一 个 STUDENT 表 ， 则 他 可 用 SRS_STUDINFO.STUDENT 指 代 e 它 。 

SQL-92 没 有 规定 SQL- 模 式 的 信息 必须 以 何 种 格式 存储 ， 但 它 要 求 每 个 目录 必须 包含 一 个 名 
为 INFORMATION_SCHEMA 的 特定 模式 ， 该 模式 的 内 容 需 精确 地 指明 。]JNFORMATION_SCHEMA 包 含 一 
组 SQL 表 ， 它 们 很 精确 地 复制 目录 中 所 有 其 他 SQL- 模 式 的 定义 。INFORMATION_ScHEMA 中 的 信息 
可 以 被 任何 授权 用 户 访问 。 

Bo, RAVER BISQL-92% CR (cluster) 作为 目录 的 集合 ， 聚 做 用 来 描述 可 以 被 单 
个 SQL 程序 访问 的 数据 库 集合 。 这 样 ， 在 大 学 这 个 例子 中 ， 可 以 定义 一 个 聚 往来 描述 大 学 维 
护 的 所 有 数据 库 ， 它 们 可 以 被 单个 的 事务 访问 。 


4.3.12 访问 控制 
数据 库 常常 包含 一 些 敏感 信息 。 因 此 ， 必 须 保 证 只 有 经 授权 的 用 户 才 能 访问 系统 ， 并 且 


O 注意 这 里 的 “模式 ” 在 意义 上 不 同 于 关系 模式 或 数据 库 模式 中 的 “模式 ”， 我 们 用 SQL- 模 式 指 代 SQL 用 法 。 
© SQL-92 有 精心 构造 的 默认 命名 机 制 ， 所 以 在 许多 情况 下 ， 是 不 需要 两 层 的 命名 限定 的 。 
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保证 用 户 只 能 访问 他 们 有 权 访 问 的 信息 。 许 多 事务 处 理 系统 会 提供 大 量 的 认证 和 授权 机 制 ， 
访问 之 前 必须 先进 行 认证 。 可 能 的 手段 包括 提供 口令 给 数据 库 管 理 系统 ， 或 者 采用 涉及 到 独 
立 的 安全 服务 器 的 更 为 复杂 的 方案 (如 第 27 章 中 所 描述 的 例子 )。 当 认证 完成 后 ， 就 认为 用 户 
已 经 和 一 个 授权 Id 正确 地 联系 在 一 起 ， 可 以 开始 对 数据 库 的 访问 。 

权限 被 赋予 某 个 特定 的 授权 Id。 当 然 多 个 用 户 可 以 有 相同 的 授权 Id， 此 时 他 们 拥有 同样 的 
权限 。 表 或 其 他 对 象 的 创建 者 拥有 该 表 或 对 象 (他 们 被 称 为 所 有 者 )， 这 样 他 们 也 就 拥有 关于 
该 对 象 的 所 有 权限 。 所 有 者 可 以 使 用 GRANT 语 句 把 关于 该 对 象 的 某 项 权限 授予 其 他 用 户 ( 即 ， 
其 他 授权 14)，GRANT 语 名 的 形式 如 下 : 


GRANT { privilege-list | All PRIVILEGES } 
ON object 
TO { authID-list | ALL } [ WITH GRANT OPTION ] 


xE, WITH GRANT OPTION 意 味 着 权限 接受 者 可 以 进一步 的 把 他 得 到 的 权限 授予 他 人 。 
如 果 对 象 是 表 或 视图 ， 则 privilege-list 包 括 : 


SELECT 

DELETE 

INSERT [(column-comma-list)] 
UPDATE [(column-comma-list)] 
REFERENCES [(column-comma-list)] 


前 面 四 个 选项 为 执行 指定 的 语句 授予 权限 ,包含 (column-comma-list) 的 选项 只 为 指定 的 列 授权 。 
比如 ， 若 INSERT 权 限 已 被 授予 ， 那 么 在 插入 的 元 组 中 中 ， 只 可 以 出 现 comma-list 中 的 属性 值 。 
所 有 的 comma-list 都 是 可 选 的 ， 这 由 中 插 号 标志 出 来 。 | 

REFERENCES 授 予 使 用 外 键 来 引用 一 个 表 或 列 的 权限 。 控 制 这 种 访问 类 型 看 起 来 有 点 奇 
E, 但 是 如 果 不 控制 外 键 约束 则 会 存在 安全 隐患 。 随 意 设 置 外 键 约束 会 引发 两 个 问题 。 假 定 
一 个 学 生 可 以 创建 如 下 的 表 : 


CREATE TABLE DontTDISMISSME ( 
Id INTEGER, 
FOREIGN KEY (Id) REFERENCES STUDENT) 


如 果 该 学 生 在 DoNTDIsMIssSME 中 播 和 一 个 包含 她 自己 的 标识 Id 的 行 ， 则 注册 人 员 不 能 “开除 ” 
该 学 生 ， 也 就 是 说 ， 不 能 从 表 STUDENT 中 删除 该 学 生 所 在 的 行 。 这 是 因为 删除 会 违反 参照 完整 
性 ， 因 而 被 数据 库 管 理 系 统 拒 绝 。 

不 受 限制 的 外 键 访问 还 会 导致 安全 漏洞 。 假如 为 保护 学 生 信 息 ， 对 STUpENT 表 的 SELECT 
访问 权限 只 赋 给 大 学 注册 办 公 室 中 的 工作 人 员 。 然 而 ， 如 果 一 个 人 侵 者 能 够 创建 上 面 所 示 的 
表 ( 表 的 名 字 可 以 是 PROBEPROTECTEDINFO) ， 那 么 就 需要 这 种 限制 不 让 该 人 侵 者 得 各 。 否 则 ， 
入侵 者 可 以 试图 在 PROBEPROTECTEDINFO 表 中 插入 某 个 14， 如 果 该 插入 操作 被 数据 库 管理 系统 
接受 ， 他 就 可 以 知道 该 Id 在 表 STUpENT 中 也 存在 ， 即 对 应 此 Id 的 个 人 是 一 个 学 生 ， 否 则 根据 参 
照 完整 性 必然 会 导致 违例 。 类 似 的 ， 若 该 插入 被 数据 库 管 理 系统 拒绝 ， 那 么 这 个 Id 对 应 的 人 

不 是 学 生 。 所 以 用 这 样 的 手段 ， 即 是 入 侵 者 没有 权限 对 表 STUDENT 执 行 SELECT 操作 ， 他 也 能 
截取 到 一 些 信息 。 

一 个 GRANT 语句 的 例子 如 下 所 示 : 
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GRANT SELECT, UPDATE (ProfId) ON STUDREGSYSTEM. TEACHING 
TO JohnSmyth, MaryDoe WITH GRANT OPTION 


该 语句 授予 John Smyth 和 Mary Doe 从 表 TEACHING 中 读 取 一 行 和 更 新 ProfId 字 段 的 权限 ,但 不 
允许 删除 和 增加 行 。 并且， 允许 他 们 把 自己 获得 的 权限 传递 给 别 的 用 户 。 

SQL 不 仅 允 许 控制 对 数据 库 的 直接 访问 ， 还 能 够 通过 视图 控制 对 数据 库 的 间接 访问 。 举 
个 例子 ， 下 面 的 语句 允许 所 有 的 校友 (alumnus) 对 (4.5) 中 定义 的 视图 PRoFSTUp 作 无 限制 的 查 
询 访 问 : 

GRANT SELECT ON ProrStup TO Alumnus 
然而 ， 校 友 们 不 能 把 查询 权利 传递 给 别人 ， 也 不 能 更 新 该 视图 。 更 有 意思 的 是 ， 尽 管 这些 用 
户 能 间接 访问 到 视图 显示 的 表 的 信息 ， 他 们 却 可 能 没有 权利 访问 TRANSscRIPT 和 TEACHING 表 , 
而 正 是 这 两 张 表 给 PRoFSTUp 提 供 内 容 。 这 方面 的 问题 在 第 6 章 会 进一步 讨论 。 

除 针对 表 之 外 ， 还 能 针对 其 他 对 象 (比如 域 ) 授予 权限 ， 这 里 不 再 详 述 。 

权限 或 者 授予 权限 的 选项 可 以 用 REVOKE 语 句 撤销 。 


REVOKE [GRANT OPTION FOR ] privilege-list 
ON object 
FROM authID-list {CASCADE | RESTRICT} 


语句 中 CASCADE 的 含义 是 ， 如 果 某 个 用 户 比如 U (他 得 到 authID-list 中 一 个 权限 14) 把 权限 
赋予 另外 一 个 用 户 如 Uz， 则 赋予 U: 的 权限 也 应 该 被 撤销 ， 如 此 一 直 进行 下 去 直到 没有 用 户 拥 
有 权限 为 止 ( 假 设 U2 又 将 权限 赋予 其 他 用 户 )。 而 RESTRICT 意 味 着 ， 如 果 权 限 存 在 这 样 的 相 
互 依赖 ， 那 么 REVOKE 语 句 被 拒绝 。 

在 许多 应 用 程序 中 ， 只 在 数据 库 操作 级 (比如 SELECT 或 UPDATE ) 授权 是 不 够 的 。 比 如 ， 
只 有 存款 人 能 在 他 的 银行 账号 存 钱 ， 只 有 银行 的 官员 可 以 给 该 账号 增加 利息 ， 但 是 存款 事务 
和 利息 事务 都 可 能 用 到 同样 的 UPDATE 语 句 。 对 这 种 应 用 ， 在 子 例 程 或 事务 这 一 级 进行 授权 
是 更 恰当 的 。 许 多 事务 处 理 系统 会 在 该 级 控制 访问 。 第 27 章 我 们 会 再 介绍 该 主题 。 


4.4 参考 书目 


关系 数据 库 模型 由 [Codd 1970, 1990] 提 出 。[Codd 1979] 在 原始 模型 上 提出 多 种 扩展 ， 这 些 扩展 模型 
提供 了 丰富 的 语义 信息 。 . 

旱 其 有 两 个 系统 实现 并 扩展 了 关系 数据 库 模型 : System R[Astrahan et al. 1981] 和 
INGRES[Stonebraker 1986]。 最 后 ，System R 演 变 成 IBM 的 商业 产品 DB2， 而 INGRES 也 成 为 一 家 同名 的 
商业 公司 的 产品 (当前 出 售 给 Computer Associates, Int}.)。 

关系 数据 库 理论 现在 已 经 极为 丰富 ， 许 多 理论 成 功 地 形成 研究 原型 甚至 商业 产品 。 更 深入 的 讨论 和 
本 书 没有 涉及 到 的 主题 可 以 在 [Maier 1983, Atzeni and Antonellis 1993, Abiteboul et al. 1995] 中 找到 。 


4.5 练习 


4.1 联系 关系 数据 库 的 定义 ， 说 明 数 据 原子 性 ， 并 和 事务 处 理 系 统 中 的 事务 原子 性 进行 比较 。 
4.2 证 明 每 个 关系 都 有 一 个 键 。 
4.3 给 出 下 面 的 概念 的 定义 : 
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4.5 


4.6 


4.7 
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a. # c. 主键 

b. 候选 键 d. 超 键 
定义 以 下 概念 : 

a. 完整 性 约束 ， .反应 性 约束 
b. 静态 完整 性 约束 ， 并 和 动态 完整 性 约束 进行 比较 e. 包含 依赖 
c. 参照 完整 性 f. 外 键 约束 


在 某 个 特定 时 刻 ， 查 看 存储 在 表 中 针对 某 个 特定 应 用 程序 的 一 些 数 据 ， 解 释 你 是 否 可 以 说 出 : 

a. 该 表 的 键 约束 是 什么 。 

b. 某 个 属性 是 否 是 键 。 

c. 该 应 用 程序 的 完整 性 约束 是 什么 。 

d. 某 个 特定 的 完整 性 约束 的 集合 是 否 被 满足 。 

使 用 SQL 的 DDL 说 明 图 4-4 中 的 学 生 注册 系统 的 模式 ， 并 包括 图 4-6 和 图 4-8 中 的 约束 。 为 属性 的 域 指 
定 较 小 的 范围 ， 如 DeptId 和 Grade 属性 。 i 

考虑 一 个 数据 库 模 式 ， 它 有 四 个 关系 : SUPPLIER, PRODUCT, CuSTOMERFICONTRACTS. SUPPLIER 
CusTOMER 有 属性 Id，Name 和 Address。Id 是 一 个 9 位 的 数字 。PRopucT 有 属性 PartNumber ( 整 型 ， 取 
值 范围 在 1 ~ 999999 之 间 ) 和 Name。CoNTRACTS 的 每 个 元 组 针对 某 个 产品 对 应 供应 商 和 顾客 之 间 的 
一 份 合同 ， 合 同 中 有 数量 和 价格 信息 。 

a. 用 SQL DDL 说 明 这 些 关 系 的 模式 ， 包 括 合适 的 完整 性 约束 (主键 ， 候 选 键 和 外 键 ) 以 及 SQL 域 。 
b. 用 SQL 的 断言 语句 说 明 下 面 的 约束 : 合同 必须 比 供应 商 多 。 


-假设 系统 中 有 2 个 账户 : STUDENT 和 ApMINISTRATOR。 用 SQL 的 GRANT 语句 为 他 们 指定 合适 的 权限 。 


解释 必须 要 REFERENCES 权 限 的 原因 ， 并 给 出 一 个 例子 说 明 通过 创建 引用 该 关系 的 外 键 约束 从 而 
获得 该 关系 的 部 分 内 容 是 可 能 的 。 = 





第 5 章 数据 库 设 计 I: 实体 -联系 模型 


既然 学 生 注册 系统 的 规格 说 明 书 已 经 被 校方 认可 ， 现 在 我 们 就 可 以 开始 系统 的 数据 库 部 
分 的 设计 。 在 第 12 章 我 们 会 介绍 事务 处 理应 用 的 完整 设计 过 程 ， 包 括 这 个 过 程 的 最 终 产 
品 一 一 设计 文档 。 这 里 我 们 讨论 数据 库 部 分 的 设计 ， 它 得 到 的 结果 是 声明 数据 模式 (如 表 、 
索引 、 域 和 断言 等 ) 的 完整 的 (可 编译 的 ) CREATE 语 句 的 集合 。 学 生 注册 系统 的 完整 设计 
参见 5.7 节 。 

数据 库 设 计 的 关键 问题 是 必须 准确 地 把 一 个 企业 多 方面 的 问题 建 模 到 关系 数据 库 中 ， 该 
关系 数据 库 可 被 众多 应 用 中 的 大 量 并 发 执行 的 事务 高 效 地 访问 和 更 新 ， 这 些 应 用 甚至 涉及 决 
策 支持 查询 。 同 其 他 的 工程 学 科 一 样 ， 利 用 特定 的 方法 学 设计 过 程 会 更 为 容易 ， 而 且 可 以 根 
据 某 些 客观 标准 来 评估 它 。 

在 本 章 中 ,我们 介绍 一 种 设计 关系 数据 库 的 流行 方法 : 实体 -联系 (E-R) 方法 ， 它 是 由 
[Chen 1976] 提 出 的 。 我 们 会 在 第 8 章 中 再 次 介绍 数据 库 设计 的 内 容 , 该 章 介绍 关系 规范 化 理论 ， 
它 给 出 如 何 评估 各 种 可 选 设计 的 客观 标准 。 

还 应 当 注 意 ，E-R 方 法 和 关系 规范 化 理论 的 许多 基本 机 人 制 已 经 由 计算 机 程序 完成 ， 因 此 ， 
它 减 轻 了 设计 者 解决 常规 设计 问题 的 任务 。 尽 管 如 此 ， 设 计数 据 库 仍 需要 良好 的 创造 力 ， 专 
门 的 技术 和 经 验 ， 并 且 掌 握 数 据 库 设 计 的 基本 理论 。 


5.1 E-R 方 法 的 概念 建 模 


为 消除 一 个 常见 的 误解 ， 我 们 必须 强调 E-R 方 法 不 是 相关 的 、 派 生 的 或 一 般 化 的 关系 数据 
模型 ， 实 际 上 ， 它 根本 不 是 数据 模型 ， 而 只 是 适用 于 (但 不 只 限于 ) 关系 模型 的 设计 方法 学 。 
这 里 ， 术 语 “联系 ” 指 的 是 该 方法 学 中 的 两 个 主要 组 件 之 一 ， 而 不 是 关系 数据 模型 。 

E-R 方 法 的 两 个 主要 组 件 是 实体 (entity) MER (relationship) 的 概念 。 实 体 是 对 企业 
中 涉及 的 对 象 的 建 模 ， 比 如 大 学 中 的 学 生 、 教 授 和 课程 。 联 系 是 对 这 些 实体 之 间 的 关联 的 建 
横 ， 比 如 教授 “ 授 ” 课 。 另 外 ， 实 体 和 联系 上 的 完整 性 约束 也 是 E-R 规 格 说 明 的 重要 方面 ， 其 
重要 性 相当 于 完整 性 约束 对 于 关系 模型 的 重要 性 。 比 如 ， 一 个 约束 规定 教授 在 一 天 中 的 某 个 
时 刻 只 能 教 一 门 课 。 

实体 -联系 图 (ERA) (请 看 一 下 图 5-1 和 图 5-3) 是 组 成 设计 的 实体 、 联 系 和 约束 的 图 形 
表示 。 同 其 他 面向 可 视 化 设计 的 方法 学 一 样 ，E-R 图 提供 的 图 形 化 设计 概括 对 设计 者 尤为 重 
E, 不仅 可 验证 设计 的 正确 性 ， 而 且 可 供 他 们 和 同事 进行 讨论 ， 并 用 该 图 向 程序 员 解释 。 但 
是 ，E-R 图 的 画 法 还 没有 相应 的 标准 ， 因 此 在 数据 库 教材 中 E-R 方 法 的 许多 方面 有 各 种 各 样 的 
变 体 。 

当 企业 用 E-R 图 建 模 完毕 ， 那 么 将 图 转化 为 相应 的 CREATE TABLE 语 句 就 比较 直接 。 然 
而 ， 这 样 的 转化 不 会 生成 唯一 的 模式 ， 特 别 是 对 于 约束 来 说 情况 更 是 如 此 ， 有 些 能 用 E-R 图 表 
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示 的 约束 在 SQL 中 没有 直接 的 对 应 。 这 些 相关 问题 会 在 适当 时 候 再 进行 讨论 。 
€E Address D € ssy 





© Hobbie 








= £ i Se. Pa TAS 
1 fe AS 
ERT 2a 


图 $-1 实体 类 型 PERSON 的 E-R 图 片断 


在 为 企业 建 模 时 ，E-R 方 法 学 中 富 于 创造 性 的 地 方 是 决定 使 用 哪些 实体 、 联 系 以 及 约束 。 
本 书 中 列举 的 简单 例子 可 能 使 人 认为 这 很 容易 做 到 ， 但 实际 上 ， 设 计 者 不 仅 需 要 丰富 的 技术 
知识 、 判 断 和 经 验 ， 还 需要 很 好 地 理解 企业 的 运作 方式 。 

E-R 方 法 学 的 一 个 重要 好 处 是 设计 者 可 以 集中 精力 考虑 企业 完整 和 精确 的 建 模 ， 而 不 必 担 
心 最 终 的 数据 库 执行 查询 或 更 新 时 是 否 高 效 。 此 后 ， 当 E-R 图 被 转化 为 CREATE TABLE 语 名 
时 ， 设 计 者 再 用 第 8 章 中 的 规范 化 理论 和 本 章 以 及 第 13 章 讨论 的 一 些 技术 来 考虑 最 后 设计 的 表 
在 性 能 方面 的 要 求 。 


5.2 实体 和 实体 类 型 


E-R 方 法 的 第 一 步 是 选择 企业 建 模 中 要 使 用 的 实体 。 实 体 很 类 似 于 对 象 ( 见 附录 A), 只 
是 实体 没有 方法 。 实 体 可 以 是 现实 世界 中 的 具体 对 象 ; 比如 John Doe 这 个 做， 停 在 Main 大 街 
123 号 的 卡 迪 拉克 轿车 或 帝国 大 厦 等 ， 也 可 以 是 抽象 的 对 象 ， 比 如 花旗 银行 的 账户 123456789、 
数据 库 课程 CS305 或 SUNY Stony Brook 大 学 的 计算 机 科学 系 。 

类 似 的 实体 可 聚合 成 实体 类 型 (entity type)。 比 如 ，John Doe, Mary Doe, Joe Blow 和 
Ann White 可 聚合 为 实体 类 型 PERSON ( 人)， 因 为 这 些 实体 都 表示 人 。John Doe 和 Joe Blow 还 
可 以 属于 实体 类 型 SrupENT， 因 为 在 第 4 章 的 数据 库 例 子 中 我 们 看 到 它们 表示 学 生 。 同样 地 ， 
Mary Doe 和 Ann White 可 归 类 到 实体 类 型 PROFESsSoR 中 。 

其 他 的 实体 类 型 有 : 

。CS305、MGT315 和 EE101， 它 们 属于 实体 类 型 COURSE。 

“Alf 和 E.T.， 它 们 属于 实体 类 型 SpACEALIEN。 

。CIA、FBI 和 IRS， 它 们 属于 实体 类 型 GOVERNMENTAGENCY 。 

1. 属 性 

和 关系 (对象 ) 相同 ， 实 体 用 属性 描述 。 实 体 的 每 个 属性 确定 该 实体 的 某 项 性 质 ; 比如 ，; 
PERSON 实 体 的 Name 属 性 通常 指定 一 串 字符 来 代表 由 数据 库 实体 表示 的 大 在 现实 世界 中 的 名 
字 。 类 似 的 ， Age 这 个 属性 指定 从 现实 世界 中 的 人 出 生 那 刻 起 地 球 围绕 太阳 已 转 过 的 次 数 。 

上 面 所 有 实体 类 型 的 例子 本 质 上 是 符合 语义 的 ， 也 就 是 说 ， 实体 类 型 由 语义 上 相关 的 实 
体 集合 组 成 。 比 如 ， 把 人 、 车 和 纸 夹 归 类 到 同一 个 实体 类 型 通常 是 无 意义 的 ， 因 为 在 一 个 典 
型 的 企业 建 模 中 它们 几乎 没有 共同 点 。 把 语义 上 相近 的 实体 归 为 一 类 才 更 有 用 ， 因 为 它们 很 
可 能 有 共性 。 例 如 ， 在 企业 里 ， 人 总 是 有 许多 共性 ， 比 如 名 字 、 年 龄 、 地 址 等 。 把 实体 类 型 
分 类 可 以 允许 我 们 将 属性 与 实体 类 型 关联 而 不 是 与 实体 本 身 关联 。 
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当然 ， 不 同 的 实体 类 型 有 不 同 的 属性 集 。 比 如 ，PAPERCLIP (R) 这 个 实体 类 型 可 能 有 
Size (尺寸 ) 和 Price (价格 ) 这 些 属性 ， 而 CouRsE 的 属性 可 能 是 CrsName、CrsCode、Credits 
Description, 

2. 域 

和 关系 模型 中 的 域 概念 相同 ， 实 体 属性 的 域 指 它 可 以 取 的 值 的 集合 。 然 而 和 关系 模型 不 
同 的 是 , E-R 属 性 的 值 可 以 是 值 集合 , 即 属性 的 值 可 以 取 相 应 域 上 的 一 组 值 而 不 仅仅 是 单个 值 ， 
比如 ， 实 体 类 型 PERSON 可 以 有 取 值 集合 的 属性 ChildrenNames 和 Hobby。 

不 能 方便 地 取 值 集合 是 关系 数据 模型 主要 缺点 之 一 ， 这 也 激发 了 对 面向 对 象 数据 建 模 的 
研究 。 然 而 ， 在 E-R 模 型 中 使 用 值 集合 的 属性 仅 是 方便 而 已 。 稍 加 努力 ， 关 系 (如 第 4 章 中 定 
义 的 ) 就 能 用 于 带 值 集合 属性 的 实体 建 模 。 

3. 键 

对 照 关 系 模型 中 键 ， 在 E-R 方 法 中 引入 和 实体 类 型 相关 的 键 约束 是 有 用 的 。 实 体 类 型 8 的 
键 约束 (Key Constraint) 是 5 的 属性 值 A ， 它 满足 以 下 条 件 : 

1) 没有 两 个 8 的 实体 对 于 去 中 的 每 个 属性 有 相同 的 值 〈 例 如 ， 两 个 不 同 的 CowPANY 实 体 其 
Name 和 Address 属 性 值 均 不 可 相同 )。 

2) 4 中 没有 子 集 具 有 上 面 第 1 条 中 的 性 质 (也 就 是 说 ， 二 是 关于 该 性 质 的 最 小 集 )。 

很 明显 ， 实 体 键 的 概念 类 似 于 关系 模型 中 的 候选 键 。 但 有 一 个 细微 之 处 ，E-R 方 法 中 的 属 
性 可 以 是 值 集合 ， 而 原则 上 这 样 的 属性 也 可 以 是 键 的 一 部 分 。 然 而 ， 实践 中 让 键 中 的 属性 取 
值 集合 是 不 大 自然 的 ， 这 往往 表示 设计 做 得 不 好 。 

4. 模式 

对 照 关 系 模型 中 的 模式 ，BE-R 方 法 中 的 横 式 (schema) 定义 为 包含 类 型 名 、 属 性 集 (以 及 
相关 联 的 域 和 每 个 属性 取 值 是 单 值 还 是 值 集合 的 指示 标志 ) 和 键 约束 的 实体 类 型 。 

5.E-R 图 表示 

在 E-R 图 中 ， 实 体 类 型 用 矩形 表示 ， 属 性 用 椭圆 表示 ， 而 取 值 集合 的 属性 用 双 椭 圆 表 示 。 
图 5-1 描 述 实体 类 型 PERsoN 的 E-R 图 ， 图 中 Hobby 属 性 的 值 取 值 集合 , “SSN” 加 下 划 线 表示 它 
是 键 。 

6. 关系 模型 中 的 表示 法 

E- .R 模 型 中 的 实体 和 关系 模型 中 的 关系 之 间 的 对 应 是 十 分 简单 的。 每 个 实体 类 型 转化 为 一 
个 关系 ， 每 个 实体 属性 转化 成 关系 的 属性 。 

但 是 ， 这 样 简单 的 转换 可 能 会 令 人 怀疑 ， 因 为 实体 的 属性 可 能 会 取 值 集合 ， 而 关系 的 属 
性 却 不 能 。 如 果 不 破坏 关系 模型 的 数据 原子 性 ( 见 4.2 节 )， 怎 样 才 可 以 把 取 值 集合 的 实体 属 
性 转化 为 相对 应 关系 的 单 值 的 属性 ? 

问题 答案 是 ， 在 转化 时 需要 用 一 组 元 组 代表 拥有 取 值 集合 的 属性 的 实体 ， 每 个 元 组 对 应 
属性 的 值 集合 中 的 一 个 元 素 。 为 说 明 这 一 点 ， 假 设 图 5- 中 的 实体 类 型 ParsoN 具 有 下 面 的 实体 
数据 : 

(111111111, John Doe, 123 Main St., {Stamps, Coins}) 


(555666777, Mary Doe, 7 Lake Dr., {Hiking, Skating}) 
(987654321, Bart Simpson, Fox 5 TV, {Acting}) 
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转化 后 ， 我 们 获得 图 5-2 所 示 的 关系 。 


ET [meee 


111111111 | John Doe 123 Main St. 
111111111 | John Doe 123 Main St. 
555666777 | Mary Doe 7 Lake Dr. 
555666777 7 Lake Dr. 
987654321 Fox 5 TV 






Stamps 













Coins 

















Hiking 









Mary Doe Skating 








Bart Simpson Acting 








图 5-2 实体 类 型 PERSON 转 化 成 的 关系 


接 下 来 的 问题 是 ， 经 过 上 面 的 转化 ， 该 为 关系 指派 什么 样 的 键 。 如 果实 体 类 型 没有 值 集 
合 的 属性 ， 那 么 答案 是 简单 的 : 实体 类 型 的 键 ( 它 是 属性 的 集合 ) 就 是 对 应 关系 模式 的 键 。 
然而 ， 如 果实 体 的 某 个 属性 是 取 值 集合 的 ， 则 确定 键 会 有 点 环 手 。 在 实体 类 型 PERsoN 中 ， 因 
没有 人 会 有 相同 的 SSN 号 ， 所 以 属性 SSN 是 键 ， 而 Hobby 属 性 的 取 值 是 所 有 Hobby 值 的 某 个 集 
合 。 转 化 为 关系 后 ， 图 5-2 中 John Doe 和 Mary Doe 由 一 对 元 组 表示 ， 他 们 的 SSN 号 都 出 现 两 次 ， 
因此 ，SSN 就 不 能 再 作为 关系 的 键 。 

显然 ， 值 集合 属性 Hobby 是 麻烦 的 始作俑者 。 为 得 到 关系 的 键 ， 我 们 就 要 把 属性 Hobby 包 
括 进来 ， 这 样 ， 图 5-2 中 关系 PERSON 的 键 是 {SSN, Hobby}. 

下 面 CREATE TABLE 语 句 用 于 定义 PERSON 关 系 的 模式 : 


CREATE TABLE PERSON ( 
SSN INTEGER, 
Name CHAR(20) , 
Address CHAR(S50), 
Hobby CHAR(10), 
PRIMARY KEY (SSN, Hobby) ) 
即使 我 们 最 终 找 到 这 样 的 键 ， 但 车 仔细 分 析 一 下 上 面 的 表 还 是 会 发 现 一 些 问题 。 首 先 ， 
我 们 觉得 不 应 该 用 Hobby 属 性 确定 PERsSoN 关 系 中 的 元 组 。 其 次 ， 在 最 初 的 实体 类 型 PERsoN 中 , 
任意 一 个 SSN 的 值 都 可 以 唯一 确定 Name 和 Address 的 值 ， 但 到 图 $-2 中 ， 虽 然 该 性 质 还 存在 ， 
但 它 已 不 能 由 主键 约束 所 反映 , 这 说 明 为 唯一 确定 一 个 元 组 , 我 们 必须 指定 SSN 和 Hobby 的 值 。 
而 在 原来 的 实体 类 型 PERSoON 中 , 是 不 需要 用 Hobby 的 值 来 决定 Name 和 Address 的 值 的 。 换言之 ， 
这 个 重要 的 约束 在 转化 过 程 中 丢失 ! 

前 述 的 例子 已 经 表明 只 使 用 E-R 方 法 是 不 能 保证 良好 的 关系 设计 的 。 第 8 章 提供 许多 客观 
标准 ， 它 们 可 以 帮助 数据 库 设计 者 评估 从 E-R 图 转化 而 来 的 关系 模式 。 特 别 地 ， 图 5-2 的 关系 
存在 的 问题 在 于 它 不 是 一 个 第 8 章 定义 的 所 谓 的 “范式 ”。 该 章 所 介绍 的 算法 能 自动 地 调整 这 
些 问 题 ， 方 法 是 将 有 问题 的 关系 分 割 成 较 小 的 符合 范式 的 关系 。 


5.3 联系 和 联系 类 型 


在 E-R 方 法 中 ， 在 实体 和 关联 这 些 实体 的 机 制 之 间 有 明显 的 差别 。 访 机制 称 为 联系 
(relationship)。 如 同 实体 归 类 为 实体 类 型 ， 关 联 相同 类 型 实体 和 有 同样 含义 的 联系 也 可 以 分 


(5.1) 
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组 为 联系 类 型 (relationship type) ©. 

比如 ，STUDENT 实 体 和 PRoGRAM 实 体 之 间 的 联系 类 型 是 MAJoRSIN ( 主 修 )。 同 样 ， 
PRoFESSOR 实 体 和 他 们 工作 的 系 之 间 的 联系 类 型 是 WoRKsIN (工作 于 )。 

我 们 需 再 一 次 强调 ，E-R 方 法 中 联系 (relationship) 的 概念 不 同 于 关系 数据 模型 中 的 关系 
(relation) 概念 。 联 系 只 是 E-R 方 法 中 的 一 个 建 模 工具 。 当 涉及 到 实现 时 ， 实 体 和 联系 都 用 数 
据 库 管理 系统 中 的 关系 (也 就 是 表 ) 表示 。 

1. 属性 和 角色 

与 实体 类 似 ， 联系 也 有 属性 。 例 如 ， 联 系 MAIORSIN 可 能 会 有 属性 Since (AM) 表示 学 生 
获准 学 习 该 专业 的 日 期 。 联 系 WoRKsIN 可 以 用 属性 Since 指 示 雇 佣 的 起 始 日 期 。 

属性 不 能 提供 有 关联 系 的 完整 的 描述 信息 。 考 虑 实体 类 型 EMPLOYEE 和 联系 REPORTSTO 
( 它 是 雇员 间 的 联系 )， 雇 员 的 两 种 类 型 是 下 属 和 老板 。 这 样 ， 若 说 <John, Bill> 是 类 型 
REPORTSTO 的 一 个 联系 ， 我 们 仍然 无 法 知道 谁 应 该 向 谁 汇报 。 

将 EMPLOYEE 实 体 类 型 分 成 SUBORDINATE (下 属 ) 和 SUPERVISOR (主管 ) 也 无 济 于 事 ， 
这 是 因为 REPoRTSTo 可 能 表示 公司 结构 中 的 整个 汇报 链 ， 这 使 得 某 些 雇员 同时 既是 下 属 也 
是 主管 。 

解决 方法 是 必须 认识 到 各 种 实体 类 型 在 联系 中 扮演 不 同 的 角色 。 对 每 种 参与 其 中 的 实体 
类 型 ， 我 们 定义 一 种 角色 (role) 并 为 之 命名 (比如 ，Subordinate )。 角 色 类 似 于 属性 ， 但 它 
不 是 说 明 联 系 的 某 种 性 质 而 是 说 明 实 体 类 型 以 什么 样 的 方式 参与 到 联系 中 去 。 角 色 和 属性 都 
是 联系 类 型 模式 的 一 部 分 。 

举 个 例子 ， 联 系 类 型 WoRKsIN 有 两 个 角色 : Professor 和 Department。 角 色 Professor 确 定 
WoRgKSIN 联 系 中 的 PRoFESsSoOR 实 体 ，Department 角 色 确 定 该 联系 中 的 DEPARTMENT 实体 。 类 似 的 ， 
联系 类 型 MAJORSIN 也 有 两 种 角色 : Student 和 Program。 

如 果 一 个 联系 中 的 所 有 实体 属于 不 同 的 实体 类 型 { 就 像 在 WoRKksIN 和 MAJoRsIN 中 那样 )， 
则 没有 必要 显 式 地 指出 角色 ， 这 是 因为 我 们 总 能 采取 一 些 约定 ， 如 在 相应 的 实体 类 型 之 后 命 
名 角色 (实践 中 经 常 这 么 做 ) 。。 然 而 ， 若 一 些 实体 来 自 同一 个 实体 类 型 ， 则 这 种 简单 的 手 
段 是 不 可 行 的 ，REPORTSTo 联 系 就 是 一 个 例子 。 这 里 ， 我 们 都 明确 地 标明 角色 ， 如 
Subordinate 和 Supervisor。 图 5-3 演 示 联 系 的 几 个 例子 ， 其 中 将 角色 清 清楚 地 标明 出 来 。 

综 上 所 示 ， 联 系 类 型 的 模式 (schema of a relationship type) 包括 : 

“若干 属性 以 及 相应 的 域 。 属 性 可 以 是 单 值 或 值 集合 。 

。 者 干 属性 以 及 相应 的 实体 类 型 。 与 属性 不 同 ， 角 色 总 是 单 值 的 。 

“ 一 组 约束 。 这 在 后 面 描述 (在 图 5-3 中 ， 用 箭头 表示 的 是 约束 )。 

一 个 联系 类 型 中 参与 的 角色 的 数量 称 为 类 型 的 度 (degree). 

现在 ,我 们 更 准确 地 定义 联系 的 概念 。 度 为 x 的 联系 类 型 RR 由 它 的 属性 41,… ,A 和 角色 

R1…,R;: 所 定义 。R 的 联系 定义 为 如 下 形式 的 元 组 集 : 


< el €27, En; G1, 2, °°", Ak > 
O ”后 文 若是 在 联系 和 实体 之 间 ， 以 及 联系 类 型 和 实体 类 型 之 间 出 现 导致 混淆 的 地 方 ， 则 就 用 术语 “联系 实例 ” 
和 “实体 实例 ”分 别 代替 “联系 ”和 “实体 ”。 
O 为 免 混淆 ， 我 们 用 不 同 的 字体 区 分 实体 类 型 和 它们 在 各 个 联系 中 扮演 的 角色 。 
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其 中 ,实体 e， 62， er 分 别 是 角色 Ri、…,R, 的 值 ; ai, 42, ***， a 分 别 是 属性 41…,A4 的 值 。 而 且 我 
们 还 假定 联系 中 属性 的 所 有 值 都 处 于 它们 各 自 的 域内 ， 所 有 的 实体 都 有 正确 的 实体 类 型 。 
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图 5-3 几 个 联系 类 型 的 E:R 图 


比如 联系 类 型 MAJORSIN 可 有 模式 : 


(Student, Program; Since) 


这 里 Student、Program 是 角色 ，Since 是 属性 。 这 个 联系 类 型 的 一 个 实例 可 能 是 : 


(Homer Simpson, EE; 1994) 


该 联系 说 明 ， 实 体 Homer Simpson 是 一 个 学 生 ， 他 在 1994 年 登记 人 学 ， 学 习 的 专业 课程 用 实体 
EE 表示 。 元 组 中 前 两 部 分 是 实体 ， 而 最 后 一 个 是 取 自 年 份 这 个 域 的 普通 值 ; 

2.E; 当 图 表示 

在 E-R 图 中 ， 联 系 类 型 用 菱形 表示 ， 角色 用 连接 联系 类 型 和 实体 类 型 的 边 表示 。 如 果 角 
色 必 须 显 式 地 命名 (这 是 由 于 联系 涉及 到 的 实体 取 自 同样 的 实体 类 型 )， 那么 角色 名 字 也 应 该 
在 图 里 给 出 。 图 5-3 显 示 我 们 讨论 过 的 儿 个 联系 的 E-R 图 (为 清楚 起 见 , 所 有 的 实体 属性 都 省 
略 )。 图 中 前 三 个 联系 是 二 元 (binary) 的 ， 因为 每 个 联系 都 关联 两 个 实体 类 型 ， 最 后 一 个 联 
AEII (ternary) 的 ， 因 为 它 关 联 三 个 实体 类 型 。 最 后 一 个 图 也 说 明 车 缺 省 的 角色 名 字 
(该 例 中 是 Project 和 Part) 被 重 命名 (如 分 别 是 Customer 和 Product)， 那 么 图 表 的 含义 有 时 会 
更 容易 表达 。 

3. Ae 

联系 的 键 能 使 设计 者 容易 、 自 然 和 一 致 地 表达 许多 约束 e 。 对 于 实体 类 型 来 说 ， 键 是 一 组 





© 大 多 数 教材 利用 多 对 一 基数 约束 定义 有 限 形式 的 联系 键 。 
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唯一 标识 实体 的 属性 。 然 而 ， 单 单 用 属性 不 能 完全 地 刻画 联系 ， 还 应 该 把 角色 考虑 进去 。 我 
们 定义 联系 类 型 R 的 键 为 R 的 属性 和 角色 的 最 小 集 ， 该 最 小 集 的 值 唯一 地 标识 联系 类 型 的 联系 
实例 。 

换言之 ， 设 R),… ,Ri 是 R 的 所 有 角色 和 集 的 子 集 ，A41,… ,4, 是 R 的 属性 子 集 ， 则 当 以 下 条 件 成 

时 ， 集合 {Ri… ,Ri, Ai AJER: 

1) 唯一 性 。R 中 没有 一 组 联系 实例 在 {Ri1… ,Ri, 41…,h,} 中 的 属性 和 角色 值 都 相间 。 

2) 最 小 性 。TR Re A1…,h,} 的 子 集 都 不 满足 性 质 1。 

在 某 些 情形 下 ， 联 系 的 键 会 有 特殊 的 形式 。 考 虑 实体 类 型 PRoFESSOR 和 DEPARTMENT 之 间 的 
联系 WoRKSIN， 可 先 合 理 地 假设 每 个 系 有 多 个 教授 但 每 个 教授 只 能 在 一 个 系 工作 。 换 言 之 
联系 WoRKSIN 以 多 对 一 (many-to-one) 的 形式 关联 教授 与 系 。 由 于 任何 给 定 的 PRoFEssoR 实 体 
最 多 只 能 在 WoRKSIN 联 系 类 型 中 出 现 一 次 ， 所 以 角色 Professor 是 WoRKSIN 的 键 。 尽 管 在 E-R 图 
中 联系 的 键 还 没有 广泛 接受 的 表示 方法 ,但 只 包含 一 个 角色 的 联系 键 可 方便 地 表示 为 : Mi 
头 代表 该 角色 ， 并 指向 萎 形 (菱形 表示 联系 )。 注意 ， 可 能 会 有 多 个 不 同 的 角色 构成 联系 的 键 ， 
所 以 在 E-R 图 中 会 有 多 个 第 头 指 向 同一 个 菱形 。 例 如 ， 图 5-3 中 {Husband} 和 {Wife} 都 是 联系 类 
”型 MARRIEpTo 的 键 ， 所 以 它们 都 用 箭头 表示 。 l 

由 多 个 角色 或 属性 组 成 的 键 一 般 用 文本 来 表示 ， 并 紧 靠 表示 相应 联系 类 型 的 菱形 。 当 表 
示 这 样 的 键 时 ， 一 般 先 列 出 角色 然后 列 出 属性 。 例 如 ， 图 $-3 中 最 后 一 张 图 的 键 可 能 是 
{Customer, Product; Date} 〈 键 中 包括 Date 是 因为 价格 可 能 会 随 着 日 期 而 浮动 )。 

然而 在 许多 情况 下 ， 联 系 的 键 会 正好 是 所 有 角色 的 集合 并 且 是 唯一 的 ， 这 样 我 们 就 不 需 
要 在 E-R 图 中 指定 键 。 

4. 在 关系 模型 中 的 表示 

把 联系 类 型 R 映 射 到 关系 模式 的 步 难 如 下 : 

。 关 系 模式 的 属性 。 关 系 模式 的 属性 是 : 

1) R 的 自身 属性 。 

2) 对 于 R 中 的 每 个 角色 ， 相 关联 的 实体 类 型 的 主键 。 

注意 ， 这 里 我 们 用 实体 类 型 的 主键 ， 而 不 是 构造 于 该 实体 类 型 的 关系 模式 的 键 。 其 原因 
是 ， 我 们 的 目标 是 确定 联系 中 涉及 的 实体 。 这 样 ， 就 和 实体 类 型 PERsoN 相 联系 的 角色 而 
言 ， 只 用 主键 SSN 而 忽略 Hobby。 
。 关 系 模 式 的 候选 键 。 大 多 数 情况 下 ， 关 系 模式 的 键 从 及 自身 的 键 的 直接 转换 取得 。 即 ， 
若 R 的 角色 有 属于 及 的 键 ， 则 和 R 相 关 的 实体 的 主键 的 属性 一 定 属于 从 了 转化 来 的 关系 模 
式 的 候选 键 。 

如 果 R 有 值 集合 的 属性 ， 则 会 有 些小 问题 。 若 是 这 样 ， 我 们 需求 助 于 早先 用 于 转化 

实体 键 为 关系 键 的 小 窍门 : 不 管 那些 值 集合 的 属性 是 否 包含 在 R 的 键 中 ， 关 系 的 候选 键 
都 应 该 包含 它们 (请 参阅 PERsoN 实 体 - 关 系 转化 的 例子 )。 注 意 ， 角 色 总 是 单 值 的 ， 所 
以 这 种 处 理 方式 不 适合 于 角色 。 
。 关 系 模式 的 外 键 约 束 。 由 于 在 E-R 模 型 中 ， 角 色 总 是 引用 一 些 实体 〈 实 体 映 射 到 关系 )， 
所 以 角色 被 转化 为 外 键 约束 。 对 应 R 的 关系 模式 的 外 键 构造 方法 如 下 : 
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对 于 及 中 的 每 个 角色 ， 其 关联 的 实体 类 型 的 主键 〈( 它 在 与 及 对 应 的 关系 模式 的 属 
性 之 中 ) 成 为 R 的 关系 模式 的 外 键 ， 该 外 键 引用 到 这 个 实体 类 型 转化 成 的 关系 。 


还 有 一 个 问题 是 实体 类 型 的 主键 (例如 SSN) 不 成 为 对 应 关系 的 主键 (例如 {SSN, Hobby}), 
这 个 问题 由 第 8 章 中 的 规范 化 理论 来 消除 。 

图 5-4 中 的 CREATE TABLE 命 令 创 建 图 5-3 中 联系 所 对 应 的 关系 模式 。 图 中 ， 在 关系 
MARRIEDTo 中 ， 没 有 定义 外 键 约束 ， 这 是 因为 尽管 SSNhusband 和 SSNwife 引 用 PERSON 关 系 的 
SSN 属 性 ， 但 SSN 不 是 该 关系 的 候选 键 。 模 式 中 的 UNIQUE 约 束 保证 SSNwife 在 表 的 任何 实例 
中 是 唯一 的 ， 这 样 它 可 作为 候选 键 。 


CREATE TABLE ”WoRKSIN ( 
Since | DATE, 
ProfId INTEGER, 
DeptId CHAR (4), 
PRIMARY KEY (ProfId), 
FOREIGN KEY (ProfId) REFERENCES PROFESSOR (Id), 
FOREIGN KEY (DeptId) REFERENCES DEPARTMENT ) 


CREATE TABLE “MARRIEDTO ( 
Date DATE, 
SS$Nhusband INTEGER, 
SSNwife INTEGER, 
PRIMARY KEY (SSNhusband) , 
UNIQUE (SSNwife) ) 


CREATE TABLE SoLD ( 
Price INTEGER, 
Date DATE, 
Projid INTEGER, 
SupplierlId INTEGER, 
PartNumber INTEGER, 
PRIMARY KEY (ProjId, SupplierId, PartNumber, Date), 
FOREIGN KEY (ProjId) REFERENCES PROJECT, 
FOREIGN KEY (SupplierId) REFERENCES SUPPLIER (Id), 
FOREIGN KEY (PartNumber) REFERENCES Part (Number) ) 





图 5-4 部 分 联系 的 转化 
我 们 看 到 ， 当 E-R 图 转换 为 表 时 ， 一 些 表 描述 实体 ， 而 另外 一 些 表 描述 联系 。 从 而 ， 图 5-3 
的 第 一 个 表 翻 译 成 三 张 表 : 一 张 表 描述 教授 的 实体 类型， 一 张 表 描 述 系 的 实体 类 型 ， 第 三 张 
描述 教授 工作 于 不 同系 的 联系 类 型 。 


5.4 E-R 方 法 的 高 级 特性 


5.4.1 实体 类 型 层次 结构 


某 些 实体 集合 之 间 会 存在 紧密 的 联系 。 比 如 ， 所 有 STUDENT 实 体 集中 的 每 个 实体 也 都 是 
PERSON 实 体 集 的 一 个 成 员 。 因 此 ，PERSoON 实 体 集 的 所 有 属性 也 适用 于 STUDENT 实 体 。 而 学 生 
实体 可 能 会 有 PERsoN 实 体 没 有 的 属性 (比如 ，Major，StartDate，GPA ); 这 种 情况 下 ， 我 们 
把 STUDENT 实 体 类 型 称 为 PERSON 实 体 类 型 的 子 类 型 。 





正式 地 说 ， 实 体 类 型 了 是 实体 类 型 R' 的 子 类 型 (subtype) 相同 于 指定 一 个 实体 间 约 束 ， 
CERA: 

1) 及 的 每 个 实体 实例 也 是 及 的 实体 实例 。 

2) R' 的 每 个 属性 也 是 R 的 属性 。 

上 面 定义 的 一 个 重要 推论 是 超 类 型 的 任何 键 也 是 它 所 有 子 类 型 的 键 。 : 

请 注意 ， 子 类 型 化 不 仅 是 约束 还 是 联系 。 该 联系 可 以 用 角色 Sub (类 型 ) 和 角色 Super 
(类 型 ) 表示 ， 通 常 称 之 为 SA (是 ) 联系 。 这 样 ， 在 ISA 联 系 中 角色 的 名 字 是 固定 的 ， 但 它们 
的 范围 取决 于 和 某 个 ISA 联 系 相关 的 实体 类 型 。 

例如 ， 在 关联 STUDENT 和 PERSON 的 IsA 联 系 类 型 中 ，S$Sub 的 范围 是 STUDENT，Super 的 范围 
是 PERSON。 该 联系 的 某 个 实例 可 能 是 <Homer Simpson, Homer Simpson> ， 它 说 明 Homer 
Simpson 既 是 学 生 也 是 人 。 注 意 ，IsA 中 涉及 的 实体 类 型 总 是 一 致 的 。 

那么 IsA 联 系 有 什么 用 呢 ? 回答 是 子 类 型 约束 引入 E-R 模 型 中 的 分 类 层次 结构 
(classification hierarchy )。 例 如 ，FRESHMAN 是 STUDENT 的 子 类 型 ， 而 STUDENT 又 是 PERSON 的 子 
类 型 。 该 性 质 是 传递 的 ， 即 FRESHMAN 也 是 PERSON 的 子 类 型 。 传 递 性 质 使 得 E-R 图 更 易 读 ， 其 
画 法 更 加 简洁 。 由 子 类 型 化 的 性 质 2 可 知 ，PERSON 的 每 个 属性 也 都 是 SrupENT 的 属性 ， 根 据 传 
递 性 它们 也 是 FERESHMAN 的 属性 。 该 现象 也 经 常 表述 为 ，STUDENT 继 承 (inherit) PERSON 的 属性 ， 
而 FRESHMAN 则 既 继承 PERSON 又 继承 STUDENT 的 属性 。 

注意 ， 这 里 并 没有 为 实体 类 型 STUDENT 和 FRESHMAN 显 式 地 指定 被 继承 的 属性 (SSN， 
Name 等 )， 但 因为 是 IsA 联 系 所 以 它们 还 是 有 效 的 属性 。 除 被 继承 的 这 些 属性 外 ，STUDENT 和 
FRESHMAN 可 能 还 有 它们 自己 的 属性 ， 而 它们 相应 的 超 类 型 是 没有 这 些 属性 的 。 图 5-5 解 释 了 这 
一 点 ， 图 中 STUDENT 是 PERSON 的 子 类 型 ， 它 继承 来 自 PERSON 的 所 有 属性 ， 因 此 就 没有 必要 为 
STUDENT 类 型 重复 指定 属性 Name 和 D.O.B. (出 生日 期 )。 类 似 的 ，FRESHMAN ，SoPHOMORE 等 是 
STUDENT 的 子 类 型 ， 因 此 也 设 有 必要 拷贝 SrupENT 和 PaRsoN 的 属性 给 它们 。 可 见 ， 传 递 性 大 大 
地 简化 了 E-R 图 。 图 中 IsA 树 的 EMPLOYEE 分 支 给 出 了 属性 继承 的 又 一 个 例子 。 联 系 “EMPLOYEE 
IsA PERSON” 表 明 每 个 EMPLOYEE 实 体 都 有 属性 Department 和 Salary。 此 外 ， 它 还 说 明 每 个 
EMPLOYEE 实 体 也 是 一 个 PERSoN 实 体 ， 因 此 也 有 属性 Name，SSN 等 。 

注意 图 5-5 中 的 每 个 IsA 三 角形 代表 不 同 的 联系 类 型 。 例 如 ， 最 上 面 的 三 角形 表示 联系 类 
AJ “EMPLOYEE IsA PERSON” 和 “STUDENT IsA PERSON”。 尽 管 这 种 表示 法 使 得 IsA 联 系 的 表示 
不 同 于 其 他 联系 的 表示 ， 但 由 于 实体 类 型 层次 结构 中 存在 多 种 约束 ， 用 该 符号 表示 它们 显得 
比较 自然 。 = 

例如 ， 属 于 实体 类 型 FRESHMAN，SoPHOMORE，JUNIOR 和 SENIOR 的 所 有 实体 可 能 就 是 类 型 
STUDENT 的 所 有 实体 (比如 在 四 年 制 的 大 学 里 )。 这 种 约束 称 为 覆盖 约束 (covering constraint), 
它 很 容易 地 附加 到 右 下 方 的 IsA 三 角形 中 。 并 且 ， 这 些 实体 集 可 能 永 不 相交 (在 绝 大 多 数 的 美 
国 大 学 里 是 这 样 的 )， 这 样 的 不 相交 约束 (disjointness constraint) 也 可 以 附加 到 右 下 方 的 三 
角形 中 。 。 


但、E-R 图 中 没有 普遍 接受 的 表示 覆盖 和 不 相交 约 东 的 方法 ， 所 以 读者 可 以 用 自己 证 欢 的 形式 来 表示 。 
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SuajorD — Major) 
图 5-5 IsA 层 次 结构 的 例子 


1. 实体 类 型 层次 结构 和 数据 分 段 

上 面 针对 IsA 联 系 的 讨论 集中 在 概念 组 织 和 属性 继承 上 。 然 而 ， 这 种 层次 结构 还 是 处 理 物 
理 数 据 分 段 (data fragmentation, 或 者 数据 分 区 (data partitioning ) ) 问题 的 一 种 好 办 法 。 数 
据 分 段 的 需求 经 常 来 自 于 分 布 式 环境 。 在 这 种 环境 下 ， 多 个 地 理 区 域 相 异 的 实体 访问 共同 的 
数据 库 。 银 行 就 是 一 个 典型 的 例子 ， 因 为 不 同 的 城市 存在 很 多 分 行 。 

在 分 布 式 企业 里 出 现 的 问题 是 网 络 延 时 : 由 于 频繁 地 执行 事务 ， 可 能 禁止 从 布 法 罗 的 银 
行 分 行 访问 数据 库 。 然 而 ， 当地 分 行 需要 的 数据 块 最 好 能 从 本 地 访问 ， 所 以 比较 好 的 办 法 是 
分 发 数据 库 中 这 样 的 信息 ， 并 让 单个 分 行 维护 它们 。 第 18 章 中 我 们 会 详细 地 讨论 在 分 布 式 数 
据 库 中 的 数据 分 段 。 其 他 使 用 数据 分 段 的 地 方 在 24.3.1 节 讨论 。 

我 们 看 看 在 数据 库 设计 阶段 怎样 处 理 数据 分 段 。 考虑 实体 类 型 CusToMER， 它 表示 银行 顾 
客 的 信息 。 对 于 每 个 分 行 ， 我 们 可 创建 子 类 型 ， 例如 NYC_CusToMER 和 BUFFALO_CUSTOMER， 
它们 与 CusToMER 之 间 的 关系 如 图 5-6 所 示 。 

我 们 观察 到 ， 和 类 型 层次 结构 相关 
的 约束 为 确定 数据 如 何 分 段 提供 了 相当 
强大 的 表达 功能 。 例 如 ， 图 5-6 可 解释 成 
这 样 的 需求 ， 即 纽约 市 和 布 法 罗 的 数据 
必须 本 地 存储 。 这 不 是 说 纽约 市 的 数据 
库 和 布 法 罗 的 顾客 数据 库 必须 是 不 相交 
的 ， 而 是 说 该 限制 可 由 早先 阐述 过 的 不 
相交 约束 所 确定 。 另 外 ， 我 们 还 可 以 增 ss ie i 
加 覆盖 约束 来 规定 如 果 把 所 有 的 分 行 客 图 5-6 用 到 IsA 联 系 的 数据 片断 
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户 合并 起 来 那么 就 得 到 银行 的 所 有 客户 的 信息 。 

2. 在 关系 模型 中 表示 ISA 层 次 结构 

有 几 种 方法 可 表示 使 用 关系 表 的 IsA 联 系 。 普 遍 采 用 的 一 种 办 法 是 先 为 表示 IsA 联 系 的 树 
的 分 支 上 的 所 有 实体 类 型 选择 一 个 候选 键 ， 并 为 每 个 实体 类 型 加 入 键 属 性 ， 然 后 如 5.2 节 所 述 。 
把 分 支 上 的 实体 转化 为 关系 。 这 里 这 样 选择 键 是 可 行 的 ， 因 为 正如 前 面 提 到 的 ， 超 类 型 的 键 
也 是 子 类 型 的 键 。 

例如 ， 在 图 5-5 中 ， 我 们 可 以 选择 {SSN} 作 为 键 ， 把 属性 SSN 加 入 到 每 个 实体 类 型 中 。 之 
后 的 转化 过 程 将 产生 如 下 的 关系 模式 : 

PERSON(SSN, Name, D.0.B.) 

STUDENT(SSN, StartDate, GPA) 

FRESHMAN(SSN) 

SOPHOMORE(SSN, Major) 

JUNIOR(SSN, Major) 

SENIOR(SSN, Major, Advisor) 

EMPLOYEE(SSN, Department, Salary) 

SECRETARY(SSN) 

TECHNICIAN(SSN, Specialization) 
当 存 在 不 相交 和 覆盖 这 样 的 约束 时 ,会 有 更 有 效 的 方法 来 表示 这 些 信息 。 例 如 ， 如 果 STUDENT 
的 所 有 子 实体 有 相同 的 属性 集 (就 是 说 ， 如 SENIOR 没 有 它 自己 的 属性 Advisor)， 那么 可 以 不 用 
5 个 关系 表示 学 生 ， 而 就 用 一 个 关系 表示 ， 该 关系 有 一 个 特殊 的 属性 Status， 它 的 取 值 范围 是 


常量 集 {Freshman, Sophomore, Junior, Senior}® 。 


5.4.2 参与 约束 


考虑 实体 类 型 PRoFESSOR 和 DEPARTMENT 之 间 的 联系 类 型 WoRKsIN， 前 面 已 经 说 过 ， 每 个 系 
可 有 多 个 教授 ， 但 每 个 教授 只 能 为 一 个 系 工作 ， 因 此 角色 PRoFESSoR 是 WoRKksIN 的 键 。 

该 键 约束 确保 没有 一 个 教授 在 类 型 WorKsIN 的 一 个 以 上 的 联系 中 出 现 ， 然 而 它 没有 办 法 
保证 一 个 教授 一 定 会 出 现在 某 个 联系 中 ， 换 言 之 ， 该 键 约束 不 能 排除 基教 授 没 能 为 某 个 系 
工作 的 情况 (这 样 他 就 可 能 因 没 有 授课 而 被 辞退 ! )。 为 解决 这 个 问题 ,设计 者 可 使 用 参与 
约束 。 
给 定 实体 类 型 E， 联系 类 型 RR 和 一 个 角色 p，R 中 角色 p 的 E 的 参与 约束 (participation 
constraint) 表示 ， 对 于 E 的 每 个 实体 实例 e， 存 在 R 中 的 一 个 联系 r， 满 足 e 以 角色 p 参 与 r。 

显然 ， 实 体 类 型 PROFESSOR 以 角色 PROFESSOR 参 与 联系 类 型 WoRKsIN， 以 保证 每 个 教授 都 在 
某 系 工作 。 l 

再 看 另外 一 个 例子 ， 例 如 为 保证 每 个 学 生 至 少 要 学 习 一 门 课 ， 先 假设 STUDENT、CoUuRsE 
和 SEMESTER 之 间 存 在 一 个 三 元 联系 TRANSCRIPT，、 我 们 可 以 为 STUDENT 实 体 类 型 施加 一 个 参与 约 
东 来 达到 这 个 目标 。 ' 


O 即使 SENIOR 有 自己 的 属性 该 转化 也 能 完成 ， 但 对 那些 不 是 大 四 (senior status) 的 学 生 他 们 的 Advisor 属 性 应 
该 置 NULL 值 。 
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在 E-R 图 中 ， 参 与 约束 由 连接 参与 实体 和 对 应 联系 的 粗 线 表示 。 如 图 5-7 所 示 ， 连 接 
PRoFFSSoR 与 WoRKSIN 的 粗 箭头 不 仅 表示 每 个 教授 至 少 参与 一 个 联系 (由 粗 线 标 出 )， 还 表示 
每 个 教授 至 多 参与 一 个 联系 (由 箭头 标 出 )， 这 也 意味 着 PRoFEssoR 实 体 和 联系 之 间 的 对 应 关 
系 是 一 对 一 的 。 


qa (Deptid 


\ l e „A Binca> 


| PROFESSOR weeny i WORKSIN > 









Grade: 


STUDENT ~ ae aa Ma 
i ¢ TRANSCRIPT Tp 








图 5-7 参与 约束 


关系 模型 中 的 表示 

从 概念 上 说 ,使 用 关系 模型 表示 参与 约束 是 十 分 容易 的 。 在 图 5-4 中 我 们 已 经 看 到 针对 
WoORKSIN 联 系 的 CREATE TABLE 语 句 。 现 在 为 实现 WoRKsIN 中 PROFESSORS 的 参与 约束 所 要 做 
的 是 指定 如 下 的 包含 依赖 : 

PROFESSOR(Id) references WorksIN(ProfId) 
恰好 ， 上 面 的 约 东 也 正好 是 外 键 约束 ， 因 为 Profrd 是 WoRksIN 的 键 。 这 样 ， 我 们 只 需 简单 地 把 
PRoFESSOR 的 Id 属性 声明 为 外 键 约束 就 实现 上 面 的 参与 约束 : 


CREATE TABLE PROFESSOR ( 
Id INTEGER, 
Name ~ CHAR(20), 
DeptId CHAR(4), 
PRIMARY KEY (Id), 
FOREIGN KEY (Id) REFERENCES Worksin (ProfId) ) 


注意 ， 上 面 的 外 键 约束 没有 排除 Id 是 空 值 的 可 能 性 ， 而 通常 来 说 ， 应 当 要 保证 Id 非 空 的 约束 。 
但 是 ， 本 例 中 Id 是 PRorEssog 的 主键 ， 所 以 就 没有 必要 再 指定 NOT NULLYQK (至 少 ， 在 SQL- 
92 兼 容 的 数据 库 中 可 以 这 样 做 )。 

我 们 还 可 以 使 转换 的 效果 更 好 一 些 。 注 意 ，Id 是 PRoFEssoR 的 键 ， 同 时 也 是 WoRksIN 的 键 
(间接 的 ， 通 过 外 键 约束 来 实现 )， 所 以 可 以 把 WoRKsIN 中 的 属性 合并 到 ProFEssoR 中 ， 在 删除 
ProfId 属 性 之 后 。 这 是 可 能 的 ， 因 为 这 两 个 表 的 共同 键 保证 每 个 PRoFESsoR 元 组 有 完全 对 应 的 
WoRKSIN 元 组 ， 并 且 连 接 这 些 元 组 也 不 会 导 到 元 余 。 产生 的 新 表 PROFESSORMERGEDWITH- 
WoRKSIN 如 下 : | 


© 包含 依赖 参见 4.2.2 节 的 介绍 。 
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CREATE TABLE PROFESSORMERGEDWITHWORKSIN ( 
Id INTEGER, 
Name CHAR (20), 
DeptId CHAR(4), 
Since DATE, 
PRIMARY KEY (Id) 
FOREIGN KEY DeptId REFERENCES DEPARTMENT ) 


尽管 从 概念 上 说 ， 关 系 模型 中 参与 约束 的 表示 就 和 指定 包含 依赖 差不多 ， 但 是 SQL-92 
中 实际 的 表示 不 会 像 前 面 例子 那样 简单 。 因 为 不 是 所 有 的 包含 依赖 都 是 外 键 约束 (04.2.2 
节 )， 而 它们 的 SQL-92 表 达 式 要 用 到 复杂 的 机 制 (比如 断言 和 触发 器 )， 而 这 些 对 性 能 都 有 
负面 影响 。 

该 情形 的 一 个 例子 是 图 $-7 中 描述 的 SrupENT 在 联系 TRANSCRIPT 中 的 参与 约束 。TRANSCRIPT 
转换 成 的 SQL-92 语 句 如 下 : 


CREATE TABLE TRANSCRIPT ( 
StudId INTEGER, 
CrsCode CHAR(6), 
Semester CHAR(6), 
Grade CHAR(1), 
PRIMARY KEY (StudId, CrsCode, Semester), 
FOREIGN KEY (StudId) REFERENCES STUDENT (Id), 
FOREIGN KEY (CrsCode) REFERENCES COURSE (CrsCode), 
FOREIGN KEY (Semester) REFERENCES SEMESTERS (SemCode)) 


同 前 面 一 样 ， 为 TRANSCRIPT 表 指定 的 外 键 约束 不 能 保证 每 个 学 生 都 会 选修 一 门 课程 。 为 保证 
每 个 学 生 都 参与 某 个 TRANSCRIPT 联 系 ，STUpENT 关 系 必 须 有 如 下 形式 的 包含 依赖 : 
STUDENT(Id) references TRANSCRIPT (StudId) 
然而 由 于 StudId 不 是 TRANSCRIPT 的 候选 键 ， 所 以 该 包含 依赖 不 能 由 外 键 约束 表示 。 在 第 4 章 中 ， 
我 们 曾 解释 过 如 何 用 CREATE ASSERTION 语 句 来 说 明 包含 依赖 (参阅 第 4 章 的 程序 (4.4) )。 
但 是 ， 验 证 普通 的 断言 通常 比 验证 外 键 约束 的 代价 高 很 多 ， 因 此 考虑 到 可 能 的 开销 ， 务 
必 谦 慎 使 用 〈4.4) 那样 的 约束 。 例 如 ， 如 果 可 以 确定 包括 这 样 的 断言 减 慢 了 数据 库 的 关键 操 
作 ， 设 计 者 可 以 把 包含 依赖 的 检查 作为 一 个 单独 的 、 周 期 性 而 不 是 实时 执行 的 事务 的 一 部 分 。 


5.5 一 个 经 纪 公司 的 例子 


我 们 已 经 使 用 学 生 注 册 系 统 解释 了 E-R 模 型 中 的 绝 大 多 数 的 概念 。 在 本 节 中 ， 我 们 再 用 一 
个 例子 来 解释 这 些 概念 。 

PSSC 是 一 个 经 纪 公司 ， 它 为 客户 买卖 股票 。 因 此 公司 的 主要 参与 者 是 经 纪 人 和 客户 。 
PSSC 在 不 同 的 城市 拥有 办 事 处 ， 每 个 经 纪 人 都 在 其 中 的 某 一 个 办 事 处 工作 。 其 中 的 某 个 经 纪 
人 还 可 以 是 他 所 工作 的 办 事 处 的 经 理 。 

客户 拥有 账户 ， 每 个 账户 都 可 以 有 多 个 拥有 者 。 每 个 账户 也 由 某 个 经 纪 人 管理 。 客 户 可 
以 有 多 个 账户 ， 经 纪 人 也 能 管理 多 个 账户 ， 但 客户 在 某 个 确定 的 办 事 处 只 能 有 一 个 账户 。 

现在 的 需求 是 设计 一 个 数据 库 维护 上 述 的 信息 ， 以 及 在 每 个 账户 上 执行 的 交易 信息 。 

图 5-8 描 述 有 关 经 纪 人 和 客户 的 基本 信息 ， 更 详细 的 信息 请 参见 图 5-9。 这 里 我 们 还 假设 经 
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纪 人 只 能 最 多 管理 一 个 办 事 处 ， 而 每 个 办 事 处 也 至 多 只 有 一 个 经 理 。 注 意 ， 这 里 我 们 没有 为 
MANAGEDBY 联 系 中 的 OFFICE 指 定 参与 约 ee gg 
束 , 因此 某 个 办 事 处 可 能 没有 经 理 (比如 ， cr Name p € Address’: 
如 果 某 个 经 理 辞职 ， 该 位 置 则 空缺 )。 

为 每 个 账户 只 被 某 个 办 事 处 的 某 个 经 纪 人 
所 维护 ， 所 以 图 5-9 显 示 一 个 参与 约束 ， 
它 对 应 联系 ISHANDLEDBY 中 的 AccoUNT 实 
体 ,箭头 方向 从 AccouNT 指 向 ISHANDLEDBY。 
这 样 ，{Account} 是 ISHANDLEDBY 的 键 。 
注意 ， 图 中 形成 实体 键 的 属性 用 下 划 线 表 

















一 BROKER. 
示 ， 且 不 同 的 键 分 别 有 不 同 的 下 划 线 ， 例 
如 OFFICE 有 两 个 键 : {Phone#} M 图 5-8 PSSC 企 业 的 ISA 层 次 结构 
{Address}, 

y een “Kecount® » N a 

SWorkPhone ~ | : DateDpened ， č Status 

Gun OWs > 
(Phones onek > l : ‘PhoneExtension# > 
<Bince: È gee 


~~ Since” 
图 5-9 客户 /经 纪 人 信息 : 首次 尝试 


但 是 ， 若 仔细 检查 图 5-9 会 发 现存 在 某 些 问题 ， 比 如 ， 它 要 求 每 个 账户 都 要 有 一 个 经 纪 人 ， 
这 可 能 是 正确 的 也 可 能 是 不 正确 的 ， 它 依赖 于 公司 的 制度 。 义 如 ， 要 求 客户 在 同一 个 办 事 处 
不 能 有 不 同 的 账户 这 个 需求 没有 在 图 中 表示 出 来 。 

图 5$-10 纠 正 了 这 些 问题 。 这 里 我 们 用 稍微 不 同 的 方法 ， 引 入 三 元 联系 HAsAccouNT， 其 键 
是 {Client，Office}。 而 且 ， 还 包含 一 个 联系 HANDLEDBY， 它 关联 账户 和 经 纪 人 ， 但 不 要 求 每 
个 账户 都 要 有 经 纪 人 。 

但 是 ， 该 图 还 有 问题 。 首 先 注 意 ， 连 接 AccouNT 和 HASAccouNT 的 边 没 有 箭头 ， 这 样 的 箭 
头 将 使 得 角色 {Account} 成 为 联系 HASAccouNT 的 键 ， 但 这 会 和 一 个 账户 可 以 有 多 个 拥有 者 的 
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要 求 相 冲 突 。 然 而 ， 这 个 新 的 设计 中 还 包含 其 他 的 问题 : 每 个 账户 正好 分 配给 一 个 办 事 处 这 
个 约 东 在 图 中 没有 表示 出 来 。HASAccoUNT 中 的 AccouNT 的 参与 约束 表示 每 个 账户 必须 至 少 分 
配给 一 个 办 事 处 (和 至 少 一 个 客户 )， 但 这 没有 说 明 办 事 处 必须 唯一 。 而 且 ， 我 们 也 不 能 为 该 
参与 约束 加 上 一 个 稍 头 来 解决 问题 ， 因 为 前 面 已 经 说 过 ， 这 会 无 法 实现 让 同一 个 账户 有 多 个 
所 有 者 的 要 求 。 


< 四 Ciccount®s, ae “Sy ae eg 
@ WorkPhonet TT C DateOpened:} Status) 









>= 


Key: (Client, Office) «<= CCOUNT Sp 





ae 


«gf ISHANDLEDBY 9。 


Worksin 





eet nnd’ Since 5 


”图 5-10 客户 /经 纪 人 信息 : 第 二 次 的 修改 

图 5-10 还 有 一 个 问题 (该 问题 在 图 5-9 中 也 存在 )。 假 设 我 们 有 下 面 的 联系 : 

(Client1, Acct1, Office1 ) € HasAccounT 

(Accti, Broker1) € HANDLEDBy 

(Broker1, Office2) € WorksIN . 
有 什么 能 够 保证 Officel1 和 Office2 是 一 样 的 (也 就 是 说 ，Account1 的 办 事 处 就 是 掌管 Accountl 
的 经 纪 人 所 在 的 办 事 处 ) ?这 个 问题 称 为 导航 陷阱 (navigation trap): 从 给 定 的 实体 Office1 
开始 ， 沿 着 由 三 个 联系 HASACCOUNT、HANDLEDBY 和 WoRKSsIN 形 成 的 三 角形 移动 ， 我 们 可 能 会 
最 终 到 达 同 一 类 型 的 另 一 个 实体 如 Office2。 在 E-R 模 型 中 ， 这 样 的 导航 陷阱 是 很 难 避 免 的 ， 
因为 车 要 这 么 做 必须 用 到 参与 约束 和 所 谓 的 函数 依赖 (functional dependency， 见 8.3 节 )， 但 
E-R 图 对 它们 只 提供 很 有 限 的 支持 ， 即 提供 键 和 参与 约束 。 。 

注意 ， 要 避免 导航 陷阱 ， 可 以 通过 删除 联系 HASAccouNT 并 引入 客户 和 账户 之 间 的 OwNS 


O 为 消除 该 例 中 的 导航 陷阱 ， 我 们 要 用 到 相当 复杂 的 包含 依赖 。 通 俗 地 说 ， 要 保证 每 个 元 组 !EHAsSAccouNT， 
其 属性 Account 要 引用 由 某 个 经 纪 人 操作 的 账户 ， 而 属性 Office 要 引用 该 经 纪 人 的 办 事 处 。 在 学 完 第 6 章 的 
基本 关系 代数 之 后 ， 读 者 会 发 现 包含 依赖 可 规范 地 表示 成 tossice.account (HANDLEDBYD< WORKSIN) 2 
TogiceAceoumt (HASACCOUNT)。 其 中 是 投影 操作 符 ( 它 去 掉 Office 和 Account 之 外 的 所 有 属性 )，fq 是 连接 操 
作 符 ( 它 将 对 应 于 HANDLEDBY 和 WoRKsIN 关 系 中 同一 个 代理 的 元 组 排列 起 来 ) 。 
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联系 来 实现 。 然 而 ， 这 又 会 回 到 前 面 的 问题 ， 即 客户 不 能 在 某 个 办 事 处 有 多 个 账户 的 约束 没 
办 法 表示 出 来 。 

即使 我 们 还 设 有 为 该 数据 库 设计 出 完全 令 人 满意 的 方案 ， 但 现在 不 妨 把 注意 力 转 到 处 理 
股票 交易 的 部 分 上 。 图 5-10 和 图 5-11 可 通过 实体 AccouNT 连 接 为 一 个 更 大 的 图 。 


(Time: ‘PricePershard? 






: ‘Munber0t Shayak: 


i “PricePerShare 8 


图 5-11 PSSC 公 司 的 交易 信息 


交易 信息 用 到 三 个 实体 : AccouNT、STocK 和 TRANSACTION。 这 些 实体 通过 联系 PosrrroN 和 
联系 TRADE 链接 在 一 起 ，PosITION 关 联 股 票 和 持 有 它们 的 账户 ，TRADE 表 示 实 际 购买 和 卖 出 的 
股票 。 这 些 信息 在 图 5-11 中 描述 。 

注意 ， 图 中 的 角色 Transaction 是 联系 TRADE 的 键 ， 且 该 事务 不 能 在 TRADE 联 系 之 外 存 
在 。 该 约束 在 图 5-11 中 由 粗 箭 头 表 示 ， 它 确定 实体 TRANSACTION 和 联系 TRADE 之 间 的 一 对 
一 关系 。 l 


5.6 E-R 方 法 的 局 限 性 


到 目前 为 止 ， 读 者 已 经 看 到 用 实体 -联系 模型 设计 数据 库 的 两 个 案例 研究 。 如 果 你 对 E-R 
设计 还 没有 完全 理解 ， 那 么 你 有 了 一 个 很 好 的 学 习 伙伴 。 尽 管 我 们 已 经 介绍 的 概念 可 以 为 组 
织 企业 数据 提供 一 般 性 的 指导 ， 但 车 要 在 实际 问题 中 应 用 它们 仍然 需要 直 富 经 验 和 技巧 。 决 
定 某 个 数据 是 否 是 实体 、 联 系 或 属性 具有 很 大 的 灵活 性 。 而 且 ， 即 使 这 些 问题 者 解决， 实体 
间 联 系 的 表现 形式 还 是 多 种 多 样 的 。 本 节 讨 论 数据 库 设 计 者 经 常会 面 对 的 困难 问题 。 

1. 实体 还 是 属性 . 

在 图 5-7 中 ， 学 期 被 表示 为 实体 。 然 而 ， 我 们 能 把 TRANSCRIPT 变 成 二 元 (而 不 是 三 元 ) 联 
系 ， 并 让 SEMESTER 成 为 它 的 一 个 属性 。 很 明显 ， 现 在 的 问题 是 哪 种 表示 办 法 更 好 。 





在 某 种 程度 上 ， 决 定 某 个 数据 表示 成 实体 还 是 属性 通常 取决 于 个 人 的 习惯 。 除 此 以 外 ， 
如 何 表 示 可 能 还 取决 于 该 数据 是 否 有 自己 的 内 部 结构 。 如 果 它 没有 自己 的 内 部 数据 结构 ， 把 
它 作 为 独立 的 实体 会 使 E-R 图 更 加 复杂 ， 而 且 更 糟 的 是 ， 当 把 E-R 图 转化 为 关系 模型 时 ， 还 会 
增加 额外 的 关系 到 数据 库 模式 中 。 另 一 方面 ， 如 果 数 据 有 它 自 己 的 属性 ， 若 把 该 数据 表示 成 
属性 ， 则 数据 的 属性 就 无 法 表示 出 来 。 

例如 在 图 5-7 中 ， 实 体 类 型 SEMESTER 没 有 它 自 己 的 属性 ， 所 以 把 学 期 信息 表示 成 实体 显得 
没有 什么 必要 。 然 而 ， 如 果 需 求 文档 中 指出 每 个 学 期 中 必须 要 有 以 下 信息 : Start_date (开始 
日 期 )，End_date (结束 日 期 )，Holidays (假期 ) 和 Enrollment (注册 人 数 )， 那 么 学 期 信息 
就 不 能 再 是 TRANSCRIPT 联 系 的 属性 ， 因 为 没有 指定 关键 的 日 期 和 学 期 相关 的 注册 人 数 (比如 ， 
某 个 学 期 中 大 学 所 有 的 注册 人 数 不 是 任何 一 个 成 绩 单 联系 的 属性 ) 这 些 信息 。 

2. 实体 还 是 联系 

再 考虑 图 $-7 中 的 E-R 图 ， 图 中 我 们 把 成 绩 单 记录 看 作 是 STupENT，CouRsSE 和 SEMESTER 实 
体 之 间 的 联系 。 还 有 一 种 设计 方案 是 把 成 绩 单 记录 作为 实体 ， 并 引入 一 个 新 的 联系 类 型 
ENROLLED 来 连接 它们 ， 如 图 5-12 所 示 。 这 里 我 们 还 合并 实体 SEMESTER 的 一 些 属性 ， 此 外 还 为 
联系 ENROLLED 增 加 属性 Credits (学 分 ) 。 。 显 然 ， 这 两 张 E-R 图 表达 的 信息 是 一 样 的 〈 除 图 
5-12 中 增加 些 属性 外 ) ， 那 么 哪个 更 好 呢 ? 


Grade > 

TRANSCAIPT — 
é Enrollment. ; 
(Credits > naan 






ionidagi 





图 5-12 成 绩 单 信息 的 另 一 种 表示 方法 
当面 临 “ 实 体 还 是 属性 ”这 样 的 两 难 选择 时 ， 个 人 喜好 是 主要 决定 因素 。 但 是 还 要 考虑 
其 他 一 些 方面 。 例 如 ， 最 好 尽量 减少 实体 和 关系 的 数目 ， 因 为 它们 直接 影响 E-R 图 转换 为 关系 
模型 时 所 生成 的 关系 的 数目 。 通 党 在 这 个 阶段 两 个 关系 堆 成 一 团 也 无 大 碍 ， 因 为 利用 第 8 章 中 
的 关系 设计 理论 可 确定 关系 是 否 需要 分 解 ， 并 且 有 相应 的 分 解 算法 可 供 利 用 。 另 一 方面 ， 发 
现 相 反 的 问题 是 比较 困难 的 ， 即 发 现 不 需要 分 解 的 关系 比较 困难 。 

再 回 到 图 5-12， 我 们 注意 到 ， 实 体 TRANSCRIPT 和 联系 ENROLLED 之 间 存 在 一 个 参与 约束 。 
此 外 ， 篆 头 从 TRANSCRIPT 指 向 ENROLLED 表 示 角 色 TRANSCRIPT 构 成 ENROLLED 联 系 的 键 ， 因 此 实 
体 类 型 TRANSCRIPT 和 联系 类 型 ENROLLED 之 间 存 在 一 对 一 的 对 应 关系 。 这 意味 着 可 认为 
ENROLLED 类 型 的 联系 是 多 余 的 ， 因 为 可 以 使 用 TRANSCRIPT 实 体 来 关联 STUDENT、CovuRsE 和 


© fán, Stony Brook 大 学 ， 一 些 研究 性 课程 需要 累积 一 定 的 学 分 才 可 选修 。 
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SEMESTER 实 体 类 型 。 为 不 丢失 信息 ， 所 需 做 的 是 在 把 TRANSCRIPT 转 变 为 联系 后 ， 将 ENROLLED 
的 属性 转移 到 TRANSCRIPT。 | 
总 结 上 面 的 讨论 ， 我 们 得 到 下 面 的 规则 : 
考虑 实体 类 型 El,…, EE, 和 关联 它们 的 联系 类 型 民 ， 假 定 El 通 过 一 个 角色 附属 于 R， 
该 角色 构成 民 的 键 ， 且 EE 和民 之 间 存 在 参与 约束 ， 那 么 可 把 EE 和 RR 合并 到 一 个 只 涉及 
到 实体 类 型 E,…,E, 的 新 的 联系 类 型 上 。 


注意 ， 该 规则 只 是 表明 也 ,可 以 合并 到 及 ， 而 不 保证 这 是 可 行 的 。 例 如 ， 如 果 也 ,还 牵涉 到 其 
他 的 联系 R'， 这 样 ， 如 果 合 并 了 和 有 R ， 则 尺 和 R' 之 间 会 存在 一 条 边 ， 但 E-R 图 的 构造 规则 不 多 
许 两 个 联系 类 型 之 间 存 在 边 。 图 $-10 中 的 BRoKER 和 AccouNT 实 体 就 有 这 样 的 情形 ， 按 照 规则 
BROKER 可 以 合并 到 WoRKSIN，AccoUuNT 可 以 合并 到 HANDLEDBY。 但 是 ， 由 于 BRoKkER 和 
AccoUNT 都 涉及 到 两 个 不 同 的 联系 ， 因 此 合并 后 图 中 WoRKksIN 和 HANDLEDBY，HASAccouNT 和 
HANDLEDBY 这 两 对 联系 之 间 都 会 有 一 条 边 。 另 外 ， 图 5-11 中 的 实体 类 型 TRANSACTION 可 以 合并 
到 联系 类 型 TRADE。 

3.48 BER . 

我 们 已 经 看 到 ， 把 实体 降 为 属性 或 者 合并 实体 到 联系 中 都 会 使 联系 的 度 发 生变 化 。 但 在 
上 面 给 出 的 例子 中 ， 即 使 经 过 转化 ，E-R 图 的 信息 内 容 仍然 保持 不 变 。 现 在 我 们 讨论 信息 丢失 
(information loss) 的 典型 情况 ， 即 表面 上 看 来 无 害 的 转换 实际 上 会 导致 E-R 图 信息 内 容 的 改 
变 ， 即 信息 丢失 。 

考虑 图 5-3 的 PARTS/SUPPLIER/PRoJECT 图 ， 某 些 设计 者 可 能 不 喜欢 使 用 三 元 联系 ， 而 喜欢 用 
多 个 二 元 联系 来 取代 它 ， 这 种 改变 会 形成 图 $-13 所 示 的 E-R 图 。 





we Screw Driving---------2 ~~. re eo me Screw | 
J Sow > B f 


a 


i 


图 5-13 用 三 个 二 元 联系 取代 图 5-3 中 的 三 元 联系 SoLD 


尽管 从 表面 上 看 ， 该 图 和 原 图 差不多 ,但 实际 上 有 几 个 细微 的 差别 。 首 先 ， 新 设计 中 引 
入 了 我 们 在 股票 交易 例子 中 见 过 的 导航 陷阱 ， 即 有 可 能 供应 商 Acme 出 售 Screw (螺丝 钉 )， 另 
外 它 还 供应 商品 给 项 目 Screw Driving ， 而 且 Screw Driving 项 目 可 能 正 使 用 Acme 所 出 售 的 螺丝 
钉 。 但 是 从 该 E-R 图 的 联系 中 没 法 得 出 是 Acme 卖 这 些 螺 丝 钉 给 这 个 项 目的 结论 ， 我 们 所 知道 
的 只 是 Acme 可 能 这 么 做 。 l 

图 中 的 另 一 个 问题 是 价格 属性 现在 和 联系 SuUPPLIES 有 关 。 这 意味 着 每 件 产 品 的 价格 都 固定 ， 
与 该 产品 供应 给 哪个 项 目 无 关 。 与 此 相反 ， 图 5-3 的 原 设计 中 支持 不 间 的 项 目 可 获得 不 同 的 价 
格 ( 例 如， 基于 采购 数量 )。 类 似 的 ， 新 的 设计 只 允许 供应 商 和 项 目 之 间 在 一 天 中 只 进行 一 次 
交易 ( 因为 这 里 每 个 交易 由 元 组 <p,s;d> 表 示 )， 因 此 没有 办 法 区 分 同一 天 中 他 们 所 做 的 多 次 交 
易 。 然 而 原 设计 中 ， 若 涉及 不 同 的 零件 ， 那 么 一 天 中 是 可 以 做 多 次 交易 的 。 
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认识 到 引入 导航 陷阱 的 危害 后 ， 我 们 可 尽 可 能 地 使 用 度数 较 高 的 联系 。 例 如 ， 在 图 5-10 
中 ， 为 消除 由 联系 HAsAccouNT、WoRKSIN 和 HANDLEDBY3 引 起 的 导航 陷阱 ， 我 们 将 这 些 联 系 合 
并 为 一 个 联系 。 然 而 ， 这 样 的 解决 方法 会 引发 更 多 的 问题 。 例 如 ， 若 该 转化 保留 连接 BRoOKER 
和 WoRKSIN 的 箭头 ， 则 我 们 于 无 意 中 引 入 “一 个 经 纪 人 至 多 只 能 有 一 个 账户 和 一 个 客户 ”这 
个 约束 。 若 不 保持 这 个 箭头 则 又 委 失 约束 “每 个 经 纪 人 被 分 配 到 一 个 办 事 处 "。 这 个 转化 也 没 
有 办 法 实现 经 纪 人 没有 账户 和 账户 没有 经 纪 人 。 

4.E-R 和 对 象 数据 库 

在 第 16 章 之 前 我 们 都 不 会 讨论 对 象 数 据 库 ， 但 这 里 我 们 要 概述 一 下 ， 一 些 从 E-R 图 转化 到 
模式 的 很 难 的 问题 在 对 象 数据 库 中 则 会 变 得 比较 容易 。 

“在 5.2 节 ， 我 们 曾 讨 论 过 关系 数据 库 中 带 有 值 集合 属性 的 实体 表示 问题 。 在 对 象 数据 库 

中 存储 的 对 象 可 有 值 集合 属性 ， 因 此 在 对 象 数据 库 中 表示 这 样 的 实体 会 相当 容易 。 
“在 5.4 节 ， 我 们 曾 讨 论 过 关系 数据 库 中 IsA 联 系 的 表示 问题 。 对 象 数据 库 在 模式 中 直接 表 
示 IsA 联 系 ， 因 此 ， 这 样 的 联系 其 表示 也 容易 多 。 
从 这 些 例子 中 我 们 可 以 看 出 ， 不 仅 把 E-R 图 翻译 到 对 象 数 据 库 的 模式 比 翻译 到 关系 数据 库 的 模 
式 通 常 要 容易 些 ， 而 且 对 许多 应 用 而 言 用 对 象 数据 库 建 模 要 比 用 关系 数据 库 建 模 直观 得 多 。 


5.7 案例 研究 ; 学 生 注 册 系 统 的 设计 


本 节 将 介绍 学 生 注册 系统 的 数据 库 设计 。 该 设计 包含 在 完整 的 应 用 程序 设计 文档 中 ， 该 
文档 在 12.1 节 中 描述 。 

设计 过 程 的 第 一 步 是 构造 如 图 5-14 所 示 的 E-R 图 ， 该 图 是 对 3.2 节 的 需求 文档 中 学 生 注册 系 
统 的 模型 。 从 图 中 我 们 注意 到 : 

“STUDENT 通过 TRANSCRIPT 关 联 到 CLAss， 这 表示 在 某 个 学 期 学 生 是 在 一 个 班级 中 注册 、 登 

记 或 完成 的 。 

"FACULTY 通 过 TEACHES 关 联 到 CLASS， 这 表示 某 个 学 期 中 一 个 教师 教授 一 门 课 ， 而 每 个 班 

级 也 正好 由 一 位 教师 授课 。 

° COURSE 通过 联系 REQuUIRES 关 联 到 CouRsE， 即 一 门 课程 可 能 是 某 个 学 期 中 的 另 一 门 课程 

的 预备 课程 。 当 预备 课程 有 效 时 ， 属 性 EnforcedSince 指 定 了 课程 的 日 期 。 

。CLASS 通 过 TAUGHTIN 关 联 到 CLAssSRooM， 也 就 是 说 某 学 期 中 一 个 班 要 在 某 个 教室 上 课 。 

“一 个 班 〈 即 提供 某 课程 ) 最 多 用 一 本 教材 ， 因 为 Textbook 属 性 不 是 实体 CLAss 的 键 的 一 

部 分 。 所 以 在 8.12 节 ， 我 们 将 删除 这 个 限制 并 讨论 它 对 系统 设计 决策 的 影响 。 

以 这 个 E-R 图 和 3.2.4 节 需求 文档 中 列 出 的 完整 性 约束 为 基础 ， 下 一 步 将 产生 模式 ， 如 图 5-15 
和 图 5-16 所 示 。E-R 图 到 关系 模式 的 转化 使 用 了 本 章 所 讨论 的 技术 ， 其 方式 比较 直接 。 注 意 ， 
没有 为 联系 TEACHES 和 TAUGHTIN 创 建 表 , 因为 它们 都 只 有 角色 而 没有 属性 , 且 都 是 多 对 一 联系 ， 
因此 它们 的 信息 可 以 存储 在 表 CLAss 中 一 一 在 CLAss 表 中 与 每 个 班级 对 应 的 元 组 包括 授课 教室 
的 标识 ClassroomId 和 授课 老师 的 标识 Instructorld。 

注意 ， 需 求 文档 中 规定 的 一 致 性 约束 在 CREATE TABLE 语 句 中 检查 【特别 是 来 自 3.2.4 节 
的 约束 1、3、5 和 6)。 在 完整 的 模式 设计 中 ， 其 他 的 完整 性 约束 用 CREATE ASSERTION 语 句 








RSF 


MEA Rif I: 
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和 触发 器 检查 。 然 而 这 部 分 设计 会 用 到 我 们 还 没有 讨论 过 的 SQL 构 造 ， 在 12.6 贡 


后 会 继续 完成 这 里 的 模式 设计 。 
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学 生 注册 系统 的 E-R 图 


图 5-14 


CREATE TABLE STUDENT ( 


Id CHAR(9) NOT NULL, 
Name 
Password 
Address CHAR(50) , 
PRIMARY KEY (Id) ) 


CREATE TABLE Facutty ( 

Id CHAR(9) NOT NULL, 
Name 
DeptId 


CHAR(4) NOT NULL, 
Password 
Address CHAR(50) ， 
PRIMARY KEY (Id) ): 


CREATE TABLE COURSE ( 


图 5-15 学 生 注册 系统 的 模式 一 一 第 1 部 分 


CHAR(6) NOT NULL, 
CHAR(4) NOT NULL, 


CrsCode 
DeptId 
CrsName 
CreditHours INTEGER NOT NULL, 
PRIMARY KEY (CrsCode), 

UNIQUE (DeptId, CrsName) ) 





CHAR(20) NOT NULL, 
CHAR(10) NOT NULL, 


CHAR(20) NOT NULL, 


CHAR(10) NOT NULL, 


CHAR(20) NOT NULL, 





83 


完 这 些 构造 
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CREATE TABLE WHENOFFERED ( 
CrsCode CHAR(6) NOT NULL, 
Semester -CHAR(6) NOT NULL, 
PRIMARY KEY (CrsCode, Semester), 


CHECK (Semester IN ('Spring','Fall') ) ) 


CREATE TABLE CLASSROOM ( 
ClassroomId CHAR(3) NOT NULL, 
Seats INTEGER NOT NULL, 
PRIMARY KEY (ClassroomId) ) 





图 5-15 (8%) 








CREATE TABLE REQUIRES ( 
CrsCode CHAR(6) NOTNULL, 
PrereqCrsCode CHAR(6) NOTNULL, 
EnforcedSince DATE NOT NULL, 
PRIMARY KEY (CrsCode, PrereqCrsCode), 
FOREIGN KEY (CrsCode) REFERENCES Course(CrsCode), 
FOREIGN KEY (PrereqCrsCode) REFERENCES CoursE(CrsCode) 












) 











CREATE TABLE Crass ( 









CrsCode CHAR(6) NOTNULL, 
SectionNo INTEGER NOTNULL, 

Semester CHAR(6) NOT NULL, 
Year INTEGER NOT NULL, 
Textbook CHAR(50) , 






ClassTime CHAR(5) , 
Enrollment INTEGER, 
MaxEnrollment INTEGER, 
ClassroomId CHAR(3), 
InstructorId CHAR(9), 
PRIMARY KEY (CrsCode,SectionNo,Semester, Year) , 
CONSTRAINT TIMECONFLICT 

UNIQUE (InstructorId, Semester, Year ,ClassTime) , 
CONSTRAINT CLASSROOMCONFLICT 

UNIQUE (Classroomld, Semester., Year ,ClassTime) , 
CONSTRAINT ENROLLMENT f . 

CHECK (Enrollment <= MaxEnrollment AND Enrollment >= 0), 
FOREIGN KEY (CrsCode) REFERENCES CourRsE(CrsCode) , 
FOREIGN KEY (ClassroomId) REFERENCES CLASSROOM (ClassroomId), 
FOREIGN KEY (CrsCode, Semester) 

REFERENCES WHENOFFERED(CrsCode, Semester), 
FOREIGN KEY (InstructorId) REFERENCES Facutty(Id) 














) 









CREATE TABLE TRANSCRIPT ( 













StudId CHAR(9) NOT NULL, 

CrsCode CHAR(6) NOTNULL, 

SectionNo INTEGER NOT NULL, 

Semester CHAR(6) NOT NULL, 

Year INTEGER NOT NULL, 
> Grade CHAR(1), 






PRIMARY KEY (StudId,CrsaCode,SectionNo, Semester, Year), 

FOREIGN KEY (StudId) REFERENCES STUDENT(Id) > 

FOREIGN KEY (CrsCode,SectionNo, Semester , Year) 
REFERENCES Cxass(CrsCode,SectionNo, Semester, Year), 

CHECK (Grade IN ('A','B','C! »'D','F','I') ), 

CHECK (Semester IN ('Spring','Fall') ) ) 










图 5-16 学 生 注册 系统 的 模式 一 一 第 2 部 分 . 
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我 们 在 本 书 中 选择 这 个 设计 例子 是 因为 它 是 直观 和 清晰 的 。 在 实践 中 ， 它 可 能 只 是 一 个 
起 点 ， 需 要 进一步 扩展 来 反映 更 多 的 特性 ， 同 时 提高 最 终 实 现 的 效率 。 

让 我 们 讨论 一 些 可 能 需要 加 强 和 可 被 替换 的 地 方 。 考 虑 课程 依赖 。 我 们 设计 的 模式 中 一 
个 明显 的 遗漏 是 “并 修 课程 ”(corequisite ) 这 个 联系 ， 所 有 的 约束 都 需要 它 。 更 微妙 地 是 ， 
大 学 课程 时 刻 在 变 : 新 课程 会 加 入 ， 老 的 课程 会 被 取消 ， 而 课程 间 的 基本 依赖 也 会 变化 。 这 
样 ， 图 5-14 中 的 REQUIRES 联 系 可 能 需要 另外 两 个 属性 Start 和 End 来 指定 预备 课程 联系 在 哪 段 时 
间 内 有 效 。 而 且 该 预备 课程 联系 可 能 会 在 不 同时 期 存在 。 例 如 ，1985 年 和 1990 年 间 〈 修 完 ) 
课程 A 是 ( 修 ) 课程 B 的 先决 条 件 ， 且 它 在 1999 年 和 现在 之 间 可 能 又 成 为 预备 课程 。 这 种 情况 
下 的 建 模 留 到 练习 5.10。 

另 一 个 有 趣 的 增强 条 件 是 ， 某 些 很 受 欢迎 的 课程 可 能 只 限于 某 些 专 业 。 在 这 种 情况 下 ， 
E-R 图 和 对 应 的 表 中 不 得 不 包含 学 生 专业 的 信息 (这 是 值 集合 属性 ! )， 且 还 要 和 课程 所 人 允许 
的 专业 一 致 。 该 问题 留 到 练习 5.11 讨 论 。 

除 加 强 我 们 的 设计 来 表达 更 复杂 的 需求 外 ， 还 可 以 利用 各 种 替代 方案 ， 但 它 可 能 会 影响 
系统 的 总 体 性 能 。 下 面 我 们 讨论 一 个 替代 方案 的 例子 和 它 的 影响 。 

考虑 实体 CoURSE 的 属性 SemsetersOffered。 因 为 它 是 值 集合 属性 ， 我 们 把 它 翻译 到 独立 的 
表 WHENOFFERED。 我 们 选择 这 个 例子 是 因为 它 可 以 容易 地 表达 约束 “开设 某 个 班 的 学 期 必须 是 
提供 该 课程 的 学 期 "。 例 如 ， 只 在 春季 学 期 提供 课程 CS305， 但 却 在 2000 年 的 秋季 设置 开设 该 
课程 的 班级 ， 这 是 不 允许 的 。 当 然 ， 如 果 春 季 和 秋季 两 个 学 期 都 提供 CS305， 那 就 没有 影响 。 

在 我 们 的 设计 中 ， 该 需求 可 简单 地 用 关系 CLAss 中 的 一 个 外 键 约束 表达 : 


FOREIGN KEY (CrsCode, Semester) 
REFERENCES WHENOFFERED(CrsCode, Semester) 


该 约束 说 明 ， 如 果 所 开课 程 的 课程 代码 是 CrsCode 的 班级 在 学 期 Semester 中 提供 ， 那 么 
<CrsCode, Semester> 应 该 是 WHENOFFERED 中 的 元 组 。 也 就 是 说 ，Semester 必 须 是 允许 开设 课 
程 的 学 期 。 

抛 开 简 化 设计 不 谈 ， 有 人 可 能 觉得 为 这 么 少 的 信息 创建 单独 的 表 会 导致 不 必要 的 开销 。 
的 确 ， 这 个 单独 的 表 有 更 多 的 存储 需求 ， 且 对 于 查询 需要 额外 的 操作 ， 等 等 ?*。 一 个 替代 方 
案 是 定义 一 个 新 的 SQL 域 (参阅 第 4 章 )， 该 域 只 包含 三 个 可 能 的 值 : 


CREATE DOMAIN SEMESTERS GHAR(6) 
CHECK ( VALUE IN ('Spring', 'Fall', 'Both') ) 


现在 ， 实 体 CouRsE 的 值 集合 属性 SemestersOffered 就 是 单 值 的 ， 但 它 取 值 范围 在 域 
SEMESTERS 中 。 这 样 做 的 好 处 是 到 关系 模型 的 转化 更 加 直接 ， 也 不 需要 额外 的 关系 
WHENOFFERED。 然 而 ， 若 要 说 明 约 束 “ 在 已 开设 相应 的 课程 时 ， 一 个 学 期 只 能 开设 这 门 课程 
的 一 个 班 ” 则 更 难 。 这 个 问题 的 细节 留 到 练习 5.12。 

最 后 ， 我 们 考虑 表示 当前 和 下 个 学 期 的 替代 方案 (这 个 需求 由 3.2 节 需求 文档 所 提供 的 某 
些 事务 规定 )。 实 际 上 ， 在 我 们 的 设计 中 没有 明显 的 途径 来 表示 这 个 信息 。 说 明 哪个 学 期 是 当 
前 学 期 或 下 一 个 学 期 ， 一 个 简单 的 办 法 创建 一 个 独立 的 表 来 存储 这 些 信 息 。 然 而 ， 这 不 是 一 

日 ”我 们 的 例子 中 ， 这 些 缺 点 好 像 都 没有 出 现 ， 这 是 由 于 通常 情况 下 ， 关 系 WHENOFFERED 都 被 用 于 验证 上 面 的 

外 键 约束 ， 而 为 “课程 -学 期 ”生成 单独 的 关系 使 得 检查 该 约束 效率 很 高 。 
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个 好 的 设计 ， 因 为 每 个 到 当前 或 下 一 个 学 期 的 引用 需要 昂贵 的 数据 库 查 询 代价 。 解 决 这 种 问 
题 的 正确 办 法 是 使 用 SQL 提 供 的 CURRENT_DATE 函 数 ， 并 用 EXTRACT 函 数 从 日 期 中 提取 某 
个 字段 ， 例 如 : 


EXTRACT(YEAR FROM CURRENT_DATE) 
EXTRACT(MONTHS FROM CURRENT_DATE) 


上 面 语 句 返 回 当前 年 和 月 的 数值 。 这 样 就 足以 确定 给 定 的 学 期 是 当前 的 学 期 还 是 下 一 个 学 期 。 
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实体 -联系 方法 在 [Chen 1976] 中 提出 。 它 自 诞生 之 日 起 就 得 到 广泛 的 关注 ， 并 且 人 们 提出 多 种 扩展 
(如 研究 论文 集 [Spaccapietra 1987])。 使 用 E-R 模 型 的 概念 设计 已 经 取得 显著 的 进步 。 读 者 可 参考 [Teorey 
1992, Batini et al: 1992, Thalheim 1992] 来 获得 全 面 的 介绍 。 

最 近 ， 出 现 了 一 种 称 为 统一 建 模 语言 (Unified Modeling Language, UML) 的 新 的 设计 方法 学 ， 并 
且 广 为 流行 [Booch et al. 1999]。UML 借 鉴 E-R 模 型 中 的 许多 思想 ， 并 在 面向 对 象 建 模 方 面 进行 了 扩展 ， 
特别 是 ， 它 不 仅 提供 数据 结构 建 模 的 方法 ， 还 提供 程序 行为 方面 的 建 模 方法 ， 以 及 在 复杂 的 计算 环境 中 
如 何 配置 复杂 的 应 用 。UML 的 大 致 介绍 可 以 参考 [Fowler and Scott 1999]。 

许多 现 有 的 工具 可 以 帮助 数据 库 设 计 者 完成 E-R 建 模 和 UML 建 模 . 这 些 工具 帮助 用 户 完成 指定 图 表 ， 
属性 ， 约 束 等 工作 。 当 这 些 工作 都 完成 后 ， 它 们 可 把 概念 模型 自动 地 映射 为 关系 表 。 这 些 工具 包括 
Computer Associates 公 司 的 ERwin，Embarcadero Technologies 公 司 的 ER/Studio 以 及 Rational Software 公 
司 的 Rational Rose。 此 外 ， 数 据 库 管理 系统 供应 商 也 提供 它们 自己 的 设计 工具 ， 如 Oracle 公 司 的 Oracle 
Designer 和 Sybase 公司 的 Power Designer。 


5.9 练习 


51 假设 你 要 通过 加 入 一 个 新 属性 (比如 5.4.1 节 描述 的 STUDENT 实 体 的 Status 属 性 ) 把 IsA 层 次 结构 转换 
成 对 象 模 型 ， 若 子 实体 是 不 相交 的 则 会 存在 什么 问题 (例如 ， 如 果 秘 书 也 可 以 是 技术 人 员 ) ? 如 果 
设 有 和 覆盖 约束 会 存在 什么 问题 (例如 ， 如 果 一 些 雇员 既 不 是 秘书 也 不 是 技术 员 ) ? 
5.2 构造 一 个 E-R 图 的 例子 ， 该 图 直接 转化 成 关系 模型 时 也 会 像 PERsoN 实 体 一 样 有 一 个 异常 (参见 有 关 
图 5-1 和 5-2 的 讨论 )。 
53 在 关系 模型 中 表示 图 5-5 的 IsA 层 次 结构 。 对 每 个 IsA 联 系 讨论 你 使 用 的 技术 (也 就 是 说 ,使 用 “将 
层次 结构 中 每 个 实体 表示 成 一 个 单独 的 关系 ” 这 种 技术 ， 还 是 使 用 “实体 和 它 的 子 实体 都 在 一 个 关 
系 中 但 用 新 的 属性 区 分 ”这 种 技术 )， 并 讨论 什么 情况 下 用 另外 一 一 种 技术 会 更 好 。 
5.4 将 5.5 节 的 经 纪 人 这 个 例子 翻译 成 SQL-92 模 式 。 用 必要 的 SQL-92 手 段 表 达 E- R 模 型 中 所 有 的 约束 。 
5.5 说 明 图 5-9 中 出 现 的 导航 陷阱 。 
5.6 考虑 下 面 的 数据 库 模 式 : 
° SUPPLIER (SName, ItemName, Price) 一 一 供应 商 SName 以 价格 Price 出 售 商品 ItemName。 
* CUSTOMER (CName, Address) 一 一 顾客 CName 住 在 Address。 
* ORDER (CName, SName, ItemName, Qty) 一 一 顾客 CName 从 供应 商 SName 处 订购 Qty 件 产品 
ItemName. 
* ITEM (ItemName, Description) 一 一 产品 的 信息 。 
a. 根据 上 面 模式 画 出 相应 的 E-R 图 ， 并 指定 键 。 





5.7 


5.8 


5.9 
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b. 假设 现在 你 要 为 该 图 增加 一 个 约束 : 每 种 广 品 由 某 个 供应 商 提供 。 修改 E-R 图 使 之 包含 该 约束 ， 
并 说 明 如 何 将 新 图 翻译 回 关系 模式 。 

用 E-R 方 法 为 你 所 在 社区 的 图 书馆 建 模 。 图 书馆 中 有 书 、CD、 磁 带 等 ， 它 们 可 借 给 读者 。 读 者 有 账 
户 、 地 址 等 信息 。 如 果 借 出 的 物品 未 按时 归还 ， 则 累积 罚款 。 然 而 有 些 读者 是 未 成 年 人 ， 因 此 必须 
有 资助 者 负责 支付 罚款 (或 者 赔偿 丢失 的 书 )。 
为 房产 中 介 公 司 设计 E-R 图 。 该 公司 登记 待 售 的 房子 的 信息 ， 并 有 想 买 房子 的 顾客 的 信息 。 待 售 的 
房子 可 由 该 公司 或 别 的 公司 “ 列 出 ， 房 子 被 “ 列 出 ”意味 着 该 房子 的 主人 和 中 介 公 司 的 代理 人 签 
署 合同 。 市 场 上 的 每 所 房子 都 有 地 址 、 价 格 、 主 人 以 及 一 些 特征 列表 〈 比 如 卧室 和 浴室 的 个 数 、 供 
热 方式 、 家 用 电器 、 车 库 大 小 等 等 )。 这 个 列表 对 于 不 同 的 房子 可 以 是 不 同 的 ， 并 且 房 子 的 属性 也 
随 房子 的 不 同 而 不 同 。 同样 地 , 每 个 顾客 都 有 他 的 偏好 , 表达 的 形式 一 样 (如 卧室 、 浴室 的 数量 等 )。 
除 此 之 外 ， 顾 客 还 可 以 指明 他 们 感 兴趣 房子 的 价格 范围 。 
一 个 连锁 超市 决定 建立 一 个 决策 支持 系统 ， 以 便 分 析 不 同时 间 在 不 同 超市 出 售 的 各 种 商品 情况 。 每 
个 超市 位 于 一 个 城市 ， 城 市 处 于 某 个 州 ， 而 州 又 处 于 某 个 区 域 里 。 时 间 可 由 天 ， 月 ， 季 度 和 年 来 度 
量 。 商 品 有 名 字 和 类 别 ( 如 农产品 ， 钢 装 食品 等 )。 为 该 应 用 设计 E-R 图 。 





5.10 为 图 5-14 所 示 的 学 生 注册 系统 修改 E-R 图 ， 加 入 并 修 课程 和 存在 于 多 个 时 期 的 预备 课程 联系 。 每 个 


3.11 


5.13 


“时 期 由 某 年 的 某 个 学 期 开始 ， 也 结束 于 某 年 的 某 个 学 期 ; 或 者 每 个 时 期 是 持续 到 现在 的 。 并 转换 


为 适当 的 关系 模型 。 

为 图 5-14 所 示 的 学 生 注册 系统 修改 E-R 图 ， 加 入 学 生 专业 和 某 课程 允许 哪些 专业 的 学 生 选 修 这 些 

信息 。 一 个 学 生 可 以 有 多 个 专业 (大 学 中 有 些 专业 会 这 样 做 ， 比 如 CSE、ISE、MUS、ECO)。 课 

ea- 个 可 允许 的 专业 列表 或 者 该 列表 为 空 ， 列表 为 空 说 明 任何 人 都 可 以 选修 该 门 课 ， 用 约束 表 
“限制 专业 的 课程 只 能 由 那些 符合 要 求 的 专业 的 学 生 选 修 ”。 

vei, Luar oee 能 用 SQL 的 断言 语句 (参见 4.3 节 ) 来 表示 ， 且 用 到 6.2 节 讨论 的 一 些 

特性 。 然 而 ， 基 于 下 面 的 简化 假设 还 是 可 以 表达 这 个 约束 的: 当 一 个 学 生 注 册 一 门 课程 时 ， 他 必 

须 声明 自己 的 专业 以 便 可 以 注册 该 课程 。 

修改 模式 以 反映 这 个 简化 过 的 假设 ， 并 表达 前 述 的 完整 性 约束 。 

对 学 生 注册 系统 的 模式 作 必要 的 修改 以 反映 使 用 5QL 域 SEMESTERS 的 设计 ( 见 5.7 节 最 后 ) 。 表 达 这 

个 约束 ， 某 班级 只 能 在 提供 相应 课程 的 学 期 里 开设 。 例 如 ， 如 果 课 程 CS305 的 属性 

SemestersOffered 值 为 Both， 那 么 对 应 的 班级 可 在 春秋 两 个 学 期 都 开设 。 但 是 ， 如 果 该 属性 的 值 是 

Spring ， 那 么 班级 只 能 在 春季 开课 。 

为 下 面 企业 设计 E-R 模 型 。 各 种 企业 组 织 之 间 互 有 业务 往来 (为 简单 起 见 ， 我 们 不 妨 假设 任意 一 笔 

业务 只 有 两 方 参与 )。 当 洽谈 业务 ( 签 协 议 ) 时 ， 每 个 企业 都 由 一 个 律师 作 代表 。 一 个 企业 可 以 和 

多 个 不 同 的 企业 有 业务 往来 ， 并 指派 不 同 的 律师 负责 各 笔 业务 。 律 师 和 企业 有 多 个 属性 ， 如 地 址 

和 名 字 。 他 们 也 有 自己 独 有 的 属性 ， 例 如 ， 律 师 有 专长 和 收费 情况 的 属性 ， 企 业 有 预算 的 属性 。 

说 明 当 维 大 于 2 的 联系 被 分 解 成 二 元 联系 时 ， 信 息 丢 失 是 如 何 发 生 的 。 讨 论 如 何 给 出 一 个 假设 ， 

在 该 假设 下 进行 分 割 不 会 导致 信息 丢失 。 





第 6 章 查询 语言 1: 关系 代数 和 SQL 


既然 知道 了 如 何 创建 一 个 数据 库 ， 那 么 下 一 步 就 要 学 习 如 何 查询 这 个 数据 库 来 为 某 个 特 
定 的 应 用 程序 检索 需要 的 信息 。 数 据 库 查询 语言 是 一 种 用 于 特定 目的 的 编程 语言 ， 它 用 来 检 
索 存 储 在 数据 库 中 的 信息 。 

在 关系 数据 库 出 现 以 前 ， 数 据 库 查 询 是 一 件 非常 麻烦 的 任务 。 即 使 是 提交 一 个 简单 的 查 
W (按照 现在 的 标准 )， 也 必须 使 用 传统 的 编程 语言 来 编写 一 段 程序 ， 这 段 程序 可 能 包含 多 个 
幅 套 循环 、 错 误 处 理 和 边界 条 件 检 查 。 另 外 ， 程 序 员 还 要 处 理 繁杂 的 内 部 物理 模式 的 细节 问 
题 ， 因 为 在 当时 数据 独立 性 还 只 是 个 愿望 而 已 。 

我 们 最 感 兴趣 的 关系 查询 语言 是 SQL (结构 化 查询 语言 ，Structured Query Language). 
它 和 传统 的 编程 语言 有 着 很 大 的 不 同 。 在 SQL 中 ， 你 指定 的 是 被 检索 的 信息 的 性 质 ， 而 不 是 
检索 所 需要 的 具体 算法 。 例 如 ， 在 学 生 注 册 系 统 中 的 某 个 查询 是 要 检索 在 某 个 学 期 里 讲授 某 
门 课 程 的 所 有 教授 的 姓名 和 Id， 但 是 它 并 设 有 给 出 遍历 多 个 数据 库 表 来 检索 指定 姓名 的 具体 
We (包括 while 循 环 、 这 语句 、 指 针 变量 等 )。 因 此 ，SQL 被 称 为 是 声明 性 (declarative) 的 ， 
因为 它 的 查询 “声明 ”答案 应 该 包含 什么 信息 ， 而 不 是 如 何 得 到 这 些 信息 。 而 传统 的 编程 语 
言 (比如 C 或 Java) 因为 在 编写 的 程序 中 描述 了 为 得 到 答案 而 要 执行 的 严密 步骤 ， 所 以 称 为 过 
程 性 (procedural ) 的 。 

程序 员 就 像 使 用 其 他 的 计算 机 语言 一 样 ， 在 简单 了 解 SQL 之 后 就 能 够 设计 出 简单 的 查询 ， 
而 要 设计 出 实际 应 用 程序 中 需要 的 复杂 查询 则 需要 对 该 语言 及 其 语义 有 更 深入 的 了 解 。 因 此 ， 
在 介绍 SQL 之 前 ， 我 们 首先 学 习 关 系 代数 。 关 系 代数 是 另外 一 种 关系 查询 语言 ， 它 被 数据 库 
管理 系统 用 作 中 间 语 言 ，SQL 语 句 在 被 优化 前 先 被 翻译 成 这 种 形式 。 在 第 7 章 中 将 介绍 其 他 的 
关系 语言 (特别 是 关系 演算 )， 并 且 将 它们 与 SQL 和 关系 代数 关联 起 来 。 


6.1 关系 代数 : 在 SQL 的 覆盖 之 下 


关系 代数 (relational algebra) 被 称 为 代数 ， 是 因为 它 基于 一 组 为 数 不 多 的 以 关系 (R) 
为 运算 对 象 的 运算 符 。 每 个 运算 符 对 一 个 或 多 个 关系 进行 运算 ， 产生 的 结果 是 另外 一 个 关系 。 
查询 就 是 包含 这 些 运 算 符 的 表达 式 。 表 达 式 的 结果 是 关系 ， 也 就 是 这 个 查询 的 答案 。 因 此 ， 
在 前 面 提 交 的 学 生 注 册 系 统 的 查询 的 结果 是 一 个 具有 两 个 属性 的 关系 ， 分 别 给 出 在 指定 学 期 
里 讲授 指定 课程 的 教授 的 姓名 和 Id。 

尽管 SQL 是 声明 性 语言 ， 这 意味 着 它 不 必 指定 用 来 处 理 查询 的 算法 ， 但 是 关系 代数 却 是 
过 程 性 的 。 关 系 表达 式 可 以 看 作 是 这 种 的 算法 的 详细 描述 (尽管 它 比 使 用 传统 编程 语言 指定 
的 算法 的 抽象 等 级 要 高 得 多 )。 

因此 ， 即 使 程序 员 用 SQL 来 指定 查询 ， 数 据 库 管理 系统 也 使 用 关系 代数 作为 一 种 指定 查 
询 计算 算法 的 中 间 语 言 。 数 据 库 管理 系统 解析 SQL 查询 ， 并 把 它 翻 译 成 关系 代数 表达 式 ， 这 
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通常 产生 一 个 相当 简单 但 很 低 效 的 算法 。 然 后 ， 查 询 优 化 器 (query optimizer) 把 这 个 代数 表 
达 式 转换 成 一 个 与 之 等 价 的 代数 表达 式 ， 但 是 (希望 ) 可 以 使 用 更 少 的 时 间 来 执行 。 查 询 
优化 器 根据 优化 后 的 代数 表达 式 ， 生 成 查询 执行 计划 (query execution plan) ， 然 后 在 数据 库 
管理 系统 中 由 代码 生成 器 将 它 转换 成 可 执行 代码 。 因 为 代数 表达 式 有 着 精确 的 数学 语义 ， 所 
以 系统 能 够 验证 优化 后 的 结果 表达 式 是 和 原先 的 表达 式 是 等 价 的 。 利 用 语义 就 能 够 比较 几 种 
不 同 的 查询 执行 计划 。 查 询 处 理 示意 图 如 图 6-1 所 示 。 


| 关系 代数 表达 式 


| 查询 执行 计划 | 


oe a EO RREO 











人 


图 6-1 查询 处 理 示 意图 


关系 代数 是 理解 关系 数据 库 管理 系统 内 部 运转 机 制 的 关键 ， 而 理解 关系 数据 库 管理 系统 
的 内 部 运行 机 制 在 设计 可 以 高 效 处 理 的 SQL 查 询 时 是 非常 重要 的 。 


6.1.1 基本 运算 符 


关系 代数 基于 五 个 基本 运算 符 : 

© EFF (select) 

* 投 影 (project) 

。 并 (union) 

。 差 ` (set difference ) 

e RIL (cartesian product， 也 称 为 叉 积 (cross product) ) 

我 们 将 依次 介绍 这 五 个 基本 运算 符 。 此 外 ， 还 有 三 个 导出 运算 符 ( 即 它们 可 以 被 表示 为 
包含 基本 运算 符 的 表达 式 ): 交 (intersection), RHE (division) 和 联结 (join )。 我 们 还 讨论 
重 命名 (renaming) 运算 符 ， 它 在 与 稍 卡 儿 积 和 联结 结合 使 用 时 很 有 用 。 


O ”查询 优化 器 并 不 真正 做 “优化 ”工作 ( 即 产 生 巡 有 效 的 查询 计算 算法 )， 因为 这 通常 是 不 可 能 做 到 的 。 相 
反 ， 它 们 使 用 已 知 的 启发 式 方法 来 产生 等 价 的 表达 式 ， 这 样 的 表达 式 的 计算 代价 通常 比较 低廉 。 
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1. 选 择 运算 符 

在 关系 上 执行 的 最 频繁 的 运算 之 一 是 对 元 组 的 子 集 的 选择 (也 就 是 在 一 个 表 中 对 行 的 某 
个 子 集 的 选择 ) 。 例 如 ， 你 可 能 想 知 道 哪 些 人 是 计算 机 科学 系 的 教授 。 当 然 ， 他 们 都 列 在 
PROFESSOR 关 系 中 ， 但 是 这 个 关系 可 能 很 大 ， 对 感 兴趣 的 元 组 进行 人 工 扫描 是 很 困难 的 。 使 用 
选择 运算 符 ， 这 个 查询 可 以 表示 为 : 

Opeptid ='cs' (PROFESSOR) 

这 个 查询 读 作 “从 关系 PROFESSOR 中 选择 所 有 满足 条 件 Deptld =“CS” 的 元 组 ”。 

选择 运算 符 的 语法 是 

Onna (KARAR) 

后 面 我 们 将 看 到 ， 选 择 运算 符 的 参数 可 能 比 一 个 简单 的 识别 某 个 关系 的 名 称 要 更 具 一 般 
性 ， 它 也 可 以 是 能 计算 到 一 个 关系 的 表达 式 。 

选择 条 件 可 能 是 下 面 几 种 形式 之 一 : 

。 简 单 选择 条 件 (下面 将 作 解 释 ) 

。 选 择 条 件 AND 选择 条 件 

。 选 择 条 件 OR 选择 条 件 

。NOT (选择 条 件 ) 
简单 选择 条 件 可 能 是 下 面 之 一 : 

。 关 系 属性 oper 常数 

。 关 系 属性 oper 关系 属性 
其 中 ，oper 可 以 是 下 面 的 几 种 比较 运算 符 之 一 : =、=* 、>、> 、< 和 < 。 参 与 比较 的 每 个 属 
性 必须 是 选择 运算 符 的 关系 名 称 参 数 里 的 一 个 属性 。 

认识 到 必须 遵 宁 上 面 的 语法 规则 是 很 重要 的 ， 就 像 在 任何 其 他 的 编程 语言 中 遵守 语法 规 
则 那样 。 编 写 查 询 来 列 出 计算 机 科学 系 教授 讲授 的 所 有 课程 ， 一 个 常见 的 语法 错误 是 : 

Oprofld = proressor ld AND Proressor Deptid='cs' ( TEACHING ) 

这 个 表达 式 可 能 看 起 来 很 自然 ， 但 是 它 在 语法 上 是 错误 的 ， 因 为 选择 条 件 用 到 了 PROFESSOR 关 系 
的 属性 ， 而 在 这 里 语法 规则 要 求 只 能 使 用 TEAcHING 关 系 (在 选择 的 参数 中 指定 的 关系 ) 的 属性 。 

孤 零 的 表达 式 ais###〈 及 ) 是 没有 什么 意义 的 ， 它 只 是 一 串 字 符 。 然 而 ， 在 具体 的 数据 库 
中 ， 它 可 能 有 一 个 值 ， 也 就 是 这 个 表达 式 在 那个 数据 库 的 上 下 文中 的 意义 。 因 此 ， 我 们 总 是 
假设 我 们 工作 在 某 个 具体 数据 库 的 上 下 文中 ， 把 具体 的 关系 实例 与 每 个 关系 名 称 相 联系 。 

假设 r 是 与 R 相 联系 的 关系 实例 ， 我 们 定义 上 面 的 表达 式 关于 r 的 值 ， 记 为 og#sg#t (r), Æ 
r 中 满足 选择 条 件 的 所 有 元 组 的 集合 构成 的 关系 。 因 此 ， 在 一 个 关系 上 运算 的 选择 运算 符 的 值 
是 另外 一 个 关系 。 

PAB. Opépria=cs (PROFESSOR) 关于 图 4-5 的 数据 库 的 值 是 关系 CSPROF。 


101202303 Smyth, John cs 
555666777 Doe, Mary cs 
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必须 清楚 r 中 的 元 组 满足 选择 条 件 的 含义 。 例 如 ， 如 果 条 件 是 4 > c<， 这 里 4 是 属性 ，c 是 常 
数 ， 当 ( 且 仅 当 ) t 中 属性 4 的 值 比 c 大 时 ， 元 组 满足 条 件 S 。 当 选择 条 件 较 复杂 的 时 候 (如 
cond, AND condy) ， 条 件 满足 是 通过 递归 来 定义 的 : 当 且 仅 当 i 油 足 condi 和 cond; 时 ，1! 才 满足 
选择 条 件 。 条 件 cond! OR cond, 是 类 似 的 ， 只 是 1 只 需要 满足 子 条 件 中 的 一 个 即 可 。 类 似 地 ， 
当 t 违 反 cond 的 时 候 ，t 满 足 NOT (cond), 

例如 ， 关 系 CSPROF 中 的 元 组 2 满足 复杂 条 件 Id > 111222333 AND NOT (DeptId = 'EE'), 
因为 它 满足 下 面 两 个 条 件 。 

e Id > 111222333 ， 因 为 5$5666777 > 111222333. 

e NOT (DeptId = 'EE')， 因 为 'CS' + 'EE' (也 就 是 说 元 组 违反 条 件 DeptId ='EE'). 
相反 ， 那 个 关系 中 的 元 组 1 违反 了 上 面 的 复杂 条 件 ， 因 为 它 违反 了 条 件 的 第 一 项 
Id > 111222333 (因为 101202303 + 111222333), 

这 里 有 一 个 较 复 杂 的 选择 : 


Ostudld + 111111111 AND (Semester = 'S1991' OR Grade =< 'B') (TRANSCRIPT) 


这 里 字符 串 间 的 比较 (Grade =< 'B') 假设 按 字典 顺序 进行 比较 。 在 图 4-5 的 数据 库 的 上 下 文中 ， 


这 个 表达 式 的 值 是 如 下 的 关系 : 
666666666 MGT123 


666666666 EEi01 
123454321 CS315 
023456789 CS305 




















选择 条 件 的 一 个 明显 的 泛 化 是 允许 使 用 形 如 exrpressiom oper expressiom 的 条 件 ， 这 里 
expression 可 能 是 一 个 涉及 属性 (ARE) 和 常数 的 算术 表达 式 ， 或 是 字符 串 表 达 式 (如 模 
式 匹 配 ， 字 符 串 连接 )。 

EmplSalary > (MngrSalary * 2) 和 (Deptld + CrsNumber ) LIKE CrsCode (这 里 “+” 表 
示 字 符 串 连接 ，LIKE 表 示 模 式 匹 配 ) 是 这 种 表达 式 的 例子 。 这 里 的 扩展 选择 的 功效 是 很 明显 
的 ， 广泛 用 在 数据 库 语 言 

2. 投影 运算 符 

在 讨论 选择 的 时 候 ， 我 们 经 常 引用 一 个 欧 组 中 某 些 属性 的 值 。 在 关系 代数 中 ， 这 样 的 引 
用 是 很 常见 的 ， 所 以 我 们 为 它们 引入 特别 的 符号 。 假设 4 表示 关系 r 的 一 个 属性 ， Bear hy 
一 个 元 组 ， 则 +4 表 示 元 组 ft 中 与 属性 4 相应 的 分 量 。 例 如 ， 如 果 ! 表 示 关 系 SuBTRANsCRIPT 中 的 
元 组 1， 那 么 CrsCode 就 是 MGT123。 

我 们 经 常 还 需要 从 一 人 元 组 中 提取 出 子 元 组 。 子 元 组 是 依照 某 个 属性 序 享 列 从 t 中 析 取 出 的 
一 个 值 的 序列 。 它 可 以 表示 成 

1.{41,…, An} 


O 我 们 假设 存在 某 种 次 序 。 在 数值 域 中 ， 这 种 次 序 是 很 明显 的 ; 在 字符 串 域 中 ， 我 们 假定 这 种 次 序 为 字典 
顺序 。 
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这 里 4, …, 4 是 属性 。 

例如 ， 如 果 t 是 SUBTRANSCRIPT 中 的 元 组 1， 那 么 t.{Semester, CrsCode} 就 是 元 组 {F1994， 
MGT123}。 注 意 ， 这 里 属性 的 顺序 没有 (也 不 需要 ) 遵照 它们 在 关系 SUBTRANsCRIPT 中 列 出 
的 上 顺序。 此外， 有 了 时 允许 在 列表 中 出 现 重复 的 属性 是 很 方便 的 。 因 而 ,it.{Semester, CrsCode, 
Semester} 是 <F1994, MGT123, F1994>。 

现在 ， 我 们 可 以 定义 投影 运算 符 了 ， 其 通常 的 语法 是 

Tanas (ARAR) 

举 个 例子 ， 如 果 R 是 关系 名 称 ，A1,…, 4A, 是 RR 中 的 一 些 (或 全 部 ) WHE, Bans, a (R) 就 
称 为 R 在 属性 41, …, 4, 上 的 投影 。( 换 名 话 说 ， 投 影 选 取 表 中 列 的 某 个 子 集 . ) 

和 选择 的 情况 一 样 ， 上 面 的 表达 式 在 具体 数据 库 的 上 下 文中 能 被 赋予 一 个 值 。 假 设 r 是 这 
样 的 数据 库 中 与 及 相应 的 关系 实例 。 那 么 za,…4A (R) 的 值 ， 记 为 za,…aA (r)， 是 形 为 
t{A 4 的 所 有 元 组 的 集合 ， 这 里 ! 的 取 值 范围 是 r 中 所 有 的 元 组 。 


ye 
PAAD, encn sence, (TEACHING) OSES 


所 示 。 MGT123 F1994 


注意 , 图 4- 5 的 最 初 的 TEACHING 关 系 有 11 个 元 组 ， EE101 si991 
而 OFFERINGS 只 有 9 个 元 组 。 其 他 的 元 组 去 哪 了 呢 ? C8305 F1995 
如 果 我 们 更 仔细 地 检查 一 下 最 初 的 关系 ， 答 案 就 一 
目 了 然 了 。 容 易 看 出 ， 元 组 1 和 元 组 4 的 CrsCode 和 gil | P1995 
Semester 属 性 是 相同 的 。 它 们 之 间 的 唯一 区 别 是 cs305 | $1996 
ProfId 属 性 的 值 不 同 。 元 组 10 和 元 组 11 也 是 同样 的 情 MAT123 
况 。 应 用 投影 运算 符 到 元 组 1 和 元 组 4 (到 元 组 10 和 一 
元 组 11) 会 产生 相同 的 元 组 ， 因 为 属性 ProfId 被 消除 了 。 关系 是 集合 ， 所 有 不 允许 有 重复 ; A 
此 在 每 组 相同 元 组 中 只 保留 其 中 一 个 元 组 。 

投影 运算 符 的 目的 是 帮助 我 们 关注 感 兴趣 的 联系 ， 而 忽略 与 某 个 查询 无 关 的 属性 。 例 如 ， 
假设 我 们 想 知道 哪些 课程 是 在 哪个 学 期 开设 的 ， 则 OFFERINGS 关 系 可 以 清楚 地 给 出 这 些 信息 ， 
没有 把 答案 和 我 们 没有 请 求 的 数据 ( 即 Profld) 混在 一 起 。 投 影 也 消除 了 重复 ， 这 也 为 我 们 分 
析 答 案 节 省 了 时 间 。 l 

既然 我 们 已 经 学 习 了 两 个 关系 运算 符 , 就 可 以 把 它们 组 合成 关系 表达 式 (relational expression). 
这 并 不 只 是 抽象 的 数学 练习 。 在 关系 数据 库 中 ， 表 达 式 是 构造 查询 的 一 般 方法 。 例 如 ， 我 们 看 到 
查找 所 有 计算 机 科学 系 教授 的 查询 ， 结 果 是 关系 CSPROF。 我 们 可 以 用 投影 运算 符 只 得 到 那些 教授 
的 姓名 ， 表 达 式 是 mtvwwn。 (CSPROF), 但 是 代数 的 优势 是 能 组 合 运 算 符 ， 所 以 我 们 可 以 写 出 


TIName (Opeptid = 'Cs' (PROFESSOR)) 


而 无 需 指 定 中 间 结 果 和 创建 临时 的 关系 。 
3. 集合 运算 符 
下 面 两 个 送 算 符 是 熟悉 的 集合 运算 符 并 (union) MÆ (set difference)。 显 然 ， 由 于 关系 
是 集合 ， 所 以 这 些 运算 符 可 以 应 用 到 关系 上 面 。 语 法 是 RUS 和 有 R-S。 如 果 r 和 s 是 与 R 和 S 相 应 
的 关系 ， 那 么 以 下 的 性 质 成 立 : 
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。R U S 的 值 是 r Us， 即 属于 r 或 的 所 有 元 组 的 集合 。 

。R-S 的 值 是 r-s， 即 r 中 不 属于 s 的 所 有 元 组 的 集合 。 

我 们 也 可 以 使 用 交 (intersection) 运算 符 ，R NS (其 在 r 和 s 上 的 值 自然 是 r ns)， 但 是 这 
个 运算 符 并 不 独立 于 其 他 的 运算 符 。 它 可 以 用 本 节 开 头 提 到 的 五 个 基本 的 运算 符 构造 的 表达 
式 来 表示 。 

但 是 , :我 们 并 没有 做 完 。 尽 管 两 个 集合 的 并 总 是 一 个 集合 ， 但 是 这 不 能 推广 到 关系 上 去 。 
考虑 计算 PRoFESSOR 和 TRANSCRIPT 的 并 。 一 个 问题 是 关系 是 表 ， 所 有 的 行 有 同样 数目 的 项 。 然 
而 在 PROFESSOR 关 系 中 ， 每 个 元 组 有 三 个 项 ， 而 在 TRANSCRIPT 关 系 中 每 个 元 组 有 四 项 。 因 为 它 
们 具有 不 同 的 元 数 ， 所 有 这 些 元 组 的 集合 并 不 构成 一 个 关系 。 

即使 元 数 相同 ， 为 了 让 并 是 有 意义 的 ， 在 相应 列 中 的 所 有 项 必须 属于 同一 个 域 。 考 虑 
PROFESSOR 和 TEACHING 的 集合 论 并 集 。 如 果 我 们 要 匹配 列 ， 在 PROFESSOR 中 的 1d、Name 和 
DeptId 将 与 Proftd、CrsCode 和 Semester 相 对 应 。 在 并 集中 ， 第 一 列 的 值 是 相同 域 的 成 员 ， 所 
以 是 没有 问题 的 。 然 而 第 二 和 第 三 列 显然 不 属于 同一 个 域 (如 人 的 姓名 和 课程 代码 )。 

为 了 解决 这 个 问题 ， 我 们 限制 并 运算 符 的 范围 ， 只 把 它 应 用 到 并 相 容 的 关系 上 去 。 如 果 
关系 的 模式 满足 下 面 的 规则 ， 那 么 它们 是 并 相 容 (union-compatible) N°. 

“两 个 关系 中 列 的 数目 相同 。 

。 两 个 关系 中 属性 的 名 称 相同 。 

。 两 个 关系 中 同名 属性 的 域 相同 。 

对 于 差 集 和 交集 运算 符 ， 我 们 也 要 求 并 相 容 。 

图 6-2 说 明了 结合 选择 和 投影 运算 符 的 集合 运算 符 的 一 些 非 平凡 的 应 用 。 第 一 个 查询 检索 
除了 MAT123 并 且 有 某 个 学 生 的 成 绩 得 了 C 的 所 有 的 课程 开设 情况 。 第 二 个 查询 有 点 不 太 自 然 ， 
但 是 一 个 很 好 的 说 明 。 它 产生 符合 以 下 条 件 的 课程 : 有 人 在 这 门 课 程 里 得 了 C 或 者 这 门 课 程 是 
MAT123。 第 三 个 查询 列 出 了 有 人 得 了 C 的 MAT123 的 所 有 课程 开设 情况 。 

这 些 例子 的 一 个 有 趣 的 方面 是 最 初 的 关系 TRANSCRIPT 和 TEACHING 不 是 并 相 容 的 。 然 而 ， 
在 经 过 投影 去 掉 不 相 容 的 属性 以 后 ， 它 们 就 变 成 相 容 的 了 。 此 图 中 的 所 有 表达 式 是 在 图 4-5 的 
运行 实例 的 上 下 文中 计算 得 到 的 。 

4. 笠 卡 儿 积 和 重 命名 

笛 卡 儿 积 (也 称 为 又 积 ) R xS， 类 似 于 在 集合 上 的 又 积 运算 : 如 果 r 和 s 分 别 是 与 R 和 S 相 
应 的 关系 实例 ， 则 这 个 表达 式 的 值 ， 记 为 r x s， 是 所 有 元 组 {的 集合 ,1 可 以 由 某 个 元 组 r E r 和 
TCAs E s 的 连接 得 到 。 。 

6-348 HH T Mia, name (STUDENT) 和 ru, pepua (PROFESSOR) 的 某 些 子 集 的 笛 卡 儿 积 。 为 了 更 
清楚 地 看 出 乘积 中 的 元 组 的 哪个 部 分 来 自 哪 个 关系 ， 我 们 用 双 线 标记 了 边界 。 


日 ”一 些 教材 中 没有 这 样 的 要 求 ， 它 们 并 不 要 求 在 两 个 关系 中 的 属性 的 名 称 是 相同 的 (但 是 仍然 要 求 域 是 相对 
应 的 )。 在 本 节 的 后 半 部 分 ， 我 们 将 引入 重 命名 运算 符 ， 它 将 有 助 于 消除 这 个 要 求 的 不 同 表 达 之 间 的 差异 。 

O 关系 上 集合 论 的 又 积 运算 和 关系 的 又 积 运算 之 间 的 差异 就 在 于 前 者 的 结果 是 一 组 形 如 (<a, b>, <c, d>) 的 元 
组 的 集合 ,而 后 者 的 结果 是 一 组 连接 的 元 组 ， 如 <a, b, c, d>。 
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CS305 Fi995 ` 


crsCode,Semester (OGrade= 1 (TRANSCRIPT) ) 
—TcrsCode Semester (OCrsCode= 'MAT123' (TEACHING) ) 


CS305 
MAT123 
MAT123 





NcrsCode,Semester (OGrade= ‘ct (TRAN SCRIPT) ) 
U fcrsCode,Semester (OCrsCode= 'MAT123' (TEACHING) ) 


MAT123 | si996 


7 crsCode,Semester (cerade- ‘Cc! (TRANSCRIPT) ) 
N NCrsCode, Semester (OCrsCode= 'MAT123' (TEACHING) ) 


图 6-2 集合 运算 符 的 例子 









111223344 Smith, Mary 


023456789 Simpson, Homer 
987654321 Simpson, Bart 





mu wus (STUDENT) 的 子 集 
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Tid, Deptld ( PROFESSOR} WFE 


111223344 
111223344 
023456789 
023456789 
987654321 
987654321 


[roman 


555666777 | 
101202303 
t 555666777 
101202303 
555666777 
101202303 














DeptId . 
cs 


Smith, Mary 









` Smith, Mary 











Simpson, Homer 







Simpson, Homer 








Simpson, Bart 





Simpson, Bart 


它们 的 第 卡 儿 积 


图 6-3 两 个 关系 和 它们 的 笛 卡 儿 积 


现在 必须 解决 一 下 属性 命名 的 问题 ， 我 们 迄今 为 止 都 尽 可 能 回避 这 个 问题 。 作 为 代数 表 
达 式 参数 的 关系 的 模式 在 系统 目录 中 定义 ， 所 以 它们 属性 的 名 称 是 已 知 的 。 相 反 ， 通 过 计算 
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表达 式 而 产生 的 关系 是 临时 创建 的 ， 它 们 的 模式 没有 显 式 定 义 。 对 于 一 些 运算 ， 如 co 和 r， 
为 我 们 可 以 简单 地 重用 参数 关系 的 模式 ， 所 以 并 不 会 引起 问题 。 对 于 U 、n 和 -， 我 们 也 不 会 
有 命名 的 问题 ， 因 为 在 这 些 运 算 中 涉及 到 的 关系 是 并 相 容 的 ， 因 此 它们 有 着 相同 的 模式 ， 又 
可 以 为 查询 结果 所 重用 。 . 

笛 卡 儿 积 使 得 我 们 第 一 次 要 处 理 命 名 问题 。 在 图 6-3 中 ， 注 意 乘积 关系 的 某 些 属 性 突然 改 
变 了 名 称 。 这 是 因为 在 运算 rmd, name (STUDENT) 和 ru, pepua (PROFESSOR) 中 涉及 到 的 关系 有 一 
个 同名 的 属性 Id， 它 将 在 乘积 中 出 现 两 次 。 关系 模型 不 允许 同一 个 关系 的 不 同 列 具有 相同 的 
名称 ， 所 以 我 们 通过 指定 属性 来 自 的 关系 来 为 其 重 命名 。 

在 上 面 的 笛 卡 儿 积 的 例子 中 ， 我 们 设法 找到 了 一 个 既 简 单 又 自然 的 重 命名 规则 ， 我 们 继 
续 通过 在 合适 的 时 候 给 关系 名 加 上 前 缀 来 消除 属性 名 的 歧义 性 。 然 而 ， 这 个 规则 并 不 总 是 有 
效 的。 例如 ， 在 PRoFESsoR 关 系 的 两 个 实例 做 叉 积 时 ， 它 将 会 失效 。 我 们 没有 去 发 明 更 为 复杂 
的 命名 规则 ， 而 是 把 这 个 工作 交 给 程序 员 ， 由 他 们 来 负责 重 命名 。 为 此 ， 我 们 引入 重 命名 运 
算 符 (renaming operator) ， 它 并 不 属于 代数 的 核心 内 容 ， 也 没有 标准 的 符号 表示 。 我 们 选用 
了 下 面 的 简单 符号 表示 : i 


expression [A,, *…, Aj] 


这 里 expression 是 关系 代数 表达 式 ， 并 且 4,, … 4 是 用 于 那个 表达 式 结果 中 的 属性 的 名 称 列表 。 
假设 "表示 在 表达 式 结果 中 列 的 数目 ， 此 外 ， 假 设 通过 计算 表达 式 而 产生 的 关系 中 列 之 
间 存 在 某 个 标准 顺序 。 例 如 ， 在 x*、o、U 、.N 和 一 的 结果 中 ， 这 个 顺序 就 是 参数 关系 的 模式 
中 属性 排列 的 顺序 。 对 于 R x S， 属 性 应 该 像 图 6-3 中 那样 排列 : R 的 属性 后 面 排列 S 的 属性 。 
例如 ， 
(sia, Name (STUDENT) X Fid, Deptld (PROFESSOR)) 
[StudId, StudName, ProfId, ProfDept] 


把 图 6-3 的 乘积 关系 的 属性 从 左 到 右 重 命名 为 Studid、StudName、Profld、ProfDept。 特 别 地 ， 
Id 的 两 次 出 现 分 别 重 命名 为 StudId 和 ProfId。 

重 命名 运算 符 也 可 以 应 用 于 子 表 达 式 。 下 面 的 例子 类 似 于 前 面 的 例子 ， 不 同 的 是 在 应 用 
其 他 运算 符 之 前 对 PROFESSOR 关 系 的 属性 进行 了 重 命名 。 


Tid, Name (STUDENT) x profid, ProfDept (PROFESSOR [ProfId, ProfName, ProfDept]) 


结果 与 前 面 的 例子 一 样 ， 但 是 现在 属性 的 名 字 ( 从 左 到 右 ) Id. Name, Profid, 
ProfDept. SSE IE AEE Ana EH 因为 参数 关系 的 属性 在 重 命名 后 
有 了 变化 。 
”第 卡 儿 积 的 独特 之 处 在 于 它 是 关系 代数 中 计算 代价 最 高 昂 的 运算 符 。 考 虑 R x S$， 假设 R 
有 n 个 元 组 ，S 有 m 个 元 组 ， 那 么 第 卡 儿 积 有 n x m 个 元 组 。 另 外 ， 乘积 中 每 个 元 组 的 规模 也 比 
较 大 。 举 个 具体 的 例子 ， 假 设 R 和 S 都 有 1000 个 元 组 ， 每 个 元 组 有 100B。 那 么 R x S 有 
1 000 000 个 元 组 ， 每 个 元 组 有 200B。 所 以 ， 尽 管 最 初 的 关系 总 的 规模 不 到 0.3MB ， 但 乘积 却 
有 200MB。 仅 把 这 样 的 关系 写 到 磁盘 上 就 会 付出 极 高 的 代价 。 这 只 是 一 个 小 例子 ， 很 快 我 们 
将 会 看 到 一 个 查询 涉及 到 三 个 乃至 更 多 关系 是 极为 寻常 的 事情 。 即 使 只 有 四 个 很 小 的 关系 ， 
每 个 关系 有 100 个 元 组 ， 一 个 元 组 有 100B ， 它 们 的 笛 卡 儿 积 有 100 000 000 个 元 组 ， 每 个 元 组 
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有 400B ， 即 40GB 的 数据 。 

在 算法 分 析 的 课程 中 ， 我 们 已 经 学 到 过 只 要 多 项 式 的 阶 数 不 太 高 ， 具 有 多 项 式 级 时 间 复 
杂 度 的 算法 是 可 以 接受 的 。 从 上 面 的 例子 中 可 以 看 出 ， 在 查询 处 理 中 ， 如 果 是 运算 涉及 大 量 
的 数据 ， 即 使 是 二 次 多 项 式 算法 也 不 可 接受 的 。 因 为 潜在 的 巨大 代价 ， 查 询 优化 器 总 是 尽 可 
能 的 避免 叉 积 。 


6.1.2 导出 运算 符 


1. 联结 
AT KARASHRE (join) 是 形 如 Rea 条 ffS 的 表达 式 。 
联结 条 件 就 是 我 们 已 经 熟悉 的 o 运 算 符 的 选择 条 件 的 特殊 形式 : 
R.A, oper, S.B, AND R.A, oper, S.B, AND … AND R.A, oper, S.B, 
这 里 41, …, 4, 是 R 的 属性 的 子 集 ，B1, …, B, 是 S 的 属性 的 子 集 。 最 后 ，oper1, …, oper' 是 比较 运 
算 符 = 、* 、> 等 等 。 和 
这 些 限制 意味 着 连接 条 件 只 能 有 AND 连 接 词 (没有 OR 和 NOT)， 不 允许 有 属性 和 常数 之 
间 的 比较 。 
尽管 我 们 用 了 新 的 符号 来 表示 联结 ， 但 是 它 并 不 是 一 个 全 新 的 运算 符 。 根 据 定 义 ， 上 面 
的 联结 等 价 于 
CO gagy (R xS) 
然而 ， 因 为 联结 在 数据 库 查询 中 频繁 出 现 ， 所 有 它们 就 有 了 拥有 自己 的 符号 的 特权 。 
图 6-4 是 两 个 关系 联结 的 例子 。 注 意 联 结 条 件 Id < I4， 这 意味 着 为 了 适合 于 作 联 结 ， 
STUDENT 元 组 中 Id 属 性 的 值 必须 比 PROFESSoR 元 组 中 Id 略 性 的 值 要 小 。 


111223344 Smith, Mary 555666777 cs 
023456789 Simpson, Homer 555666777 cs 
023456789 Simpson, Homer 101202303 ` cs 


Tia, Name (STUDENT) D< jgcta Tid, Depta (PROFESSOR) 
图 6-4 图 6-3 中 关系 的 联结 


注意 ， 联 结 的 定义 涉及 到 作为 中 间 步 又 的 笛 卡 儿 积 。 因 此 ， 联 结 是 潜在 的 代价 昂贵 的 运 
算 。 但 是 ， 笛 卡 儿 积 隐藏 在 联结 中 。 实 际 上 ， 笛 卡 玫 积 很 少 独立 地 出 现在 典型 的 数据 库 查询 
中 。 因 而 ， 尽 管 中 间 结果 (RR) 可 能 是 很 大 的 ,但 最 后 的 结果 却 是 可 处 理 的 ， 因 为 乘积 中 
只 有 一 小 部 分 元 组 可 能 满足 联结 条 件 。 i 

例如 ， 图 6-4 中 联结 的 结果 是 图 6-3 中 第 卡 儿 积 大 小 的 一 半 。 联 结 的 大 小 只 是 相应 又 积 的 
大 小 的 很 小 一 部 分 是 很 常见 的 事情 。 这 里 需要 技巧 的 部 分 是 计算 联结 而 不 必 计 算 中 间 的 笛 卡 
JLB! 这 可 能 听 起 来 很 不 可 思议 ， 但 是 有 若干 种 方法 能 完成 这 个 工作 ， 查 询 优化 器 会 经 常 这 
么 做 。 l 

上 面 描述 的 是 普通 的 联结 ， 有 时 也 被 称 为 theta 联 结 (theta-join)， 因 为 在 古代 希腊 字母 6 
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用 来 表示 联结 条 件 。 尽 管 theta 联 结 在 查询 处 理 中 是 很 常见 (查询 列 出 薪水 比 其 经 理 多 的 所 有 
职员 就 涉及 到 theta 联 结 ) ， 更 常见 的 是 所 有 的 比较 都 是 等 号 : 
R.A, = S.B, AND … AND R.A, = S.B, 

使 用 这 样 条 件 的 联结 叫做 等 值 联 结 (equijoin). 

等 值 联结 实质 上 给 关系 数据 库 赋予 了 智能 ， 因 为 它们 把 分 散在 数据 库 中 的 根本 不 同 的 数据 
联系 到 一 起 。 使 用 等 值 联结 ， 程 序 员 用 几 行 SQL 代码 就 可 以 揭示 隐藏 在 数据 之 下 的 复杂 联系 。 

下 面 的 例子 说 明 如 何 找到 在 1994 年 秋季 授课 的 教授 的 姓名 : 

NName (PROFESSOR D< Ja = Profid Osemester = 'F1994' (TEACHING)) 


内 层 的 联结 把 PROFESSOR 中 的 元 组 依照 TEACHING 中 的 元 组 来 排列 ，TEACHING 中 的 元 组 描述 了 各 
个 教授 在 1994 年 秋季 教授 课程 的 情况 。 最 后 的 投影 去 掉 了 不 感 兴趣 的 属性 。 找 出 在 1995 年 秋 
季 开 设 的 课程 名 称 和 任课 教授 的 姓名 也 很 容易 : 


NCrsName, Name ( 
(PROFESSOR D414 = Profid OSemester = fl995 (TEACHING)) 
D< crsCode = CrsCode COURSE 
) 

上 面 的 查询 涉及 到 两 个 联结 。 我 们 在 第 一 个 连接 的 周围 加 上 圆 括 号 ， 来 指出 计算 联结 的 次 序 。 
然而 ， 这 并 不 是 必须 的 ， 因 为 联结 恰好 是 结合 (associative) 运算 符 ， 这 可 以 由 其 定义 得 以 
证 明 。 7 l 

R PScona, (S PS cone T) 

= cond, (R x cona, (S x T)) xt Me 

= Ocona, (Gcona, (R x (SxT))) 因为 c 和 > 可 交换 (检验 !) 

= Gcond (Goon, (Rx (S x T))) ”因为 两 个 o 可 交换 (检验 !) 

= Ocondy (Gcona, ((RxS)xT) 通过 x 的 结合 性 (检验 !) 

= (R Poona, S) P< cona, T it Os AE ML 

上 面 的 双 联 结 查询 说 明了 另外 一 个 要 点 。 像 TeAcHING.CrsCode = CouRSE.CrsCode 这 样 用 
来 测试 同名 属性 〈 但 在 不 同 关系 中 ) 等 值 的 联结 条 件 是 很 常见 的 。 这 主要 是 因为 给 表示 同一 
事物 但 分 属 不 同 关系 的 属性 赋予 相同 的 名 字 是 一 个 好 的 设计 思路 。 例 如 , Course, 
TEACHING 和 TRANSCRIPT 中 CrsCode 的 语义 是 一 样 的 (这 就 是 在 这 三 个 关系 中 都 使 用 相同 名 字 的 
原因 )。 因为 找 出 数据 中 的 隐藏 联系 等 同 于 在 不 同 关系 中 比较 类 似 属性 ， 所 以 上 面 的 设计 思路 
导致 了 同名 属性 相等 的 等 值 联结 条 件 。 。 

事实 上 ， 这 个 设计 思路 使 得 大 多 数 等 值 联结 的 联结 条 件 只 是 同名 属性 之 间 的 相等 。 认 识 
到 它们 重要 性 之 后 ， 这 样 的 联结 就 有 了 它们 自己 的 名 称 : 自然 联结 (natural join )。 自 然 联结 


O ”我们 很 自然 会 问 ， 为 什么 我 们 为 SrupENT(Id) 和 TRANSCRIPT(StudId) 中 的 Id 属性 使 用 了 不 同 的 名 称 ， 这 显然 违 
反 了 之 前 提 到 的 设计 惯例 。 这 个 答案 是 很 简单 的 。 我 们 之 所 以 这 样 做 是 为 了 能 够 从 一 个 合适 大 小 的 模式 中 
举 出 更 多 的 例子 。 在 一 个 设计 良好 的 数据 库 模式 中 ， StudId 可 能 在 两 个 地 方 都 用 到 ; 同样 的 ，Profld 可 能 在 
PROFESSOR 和 TEACHING 中 都 用 到 ; Id 可 能 在 这 四 个 地 方 都 用 到 。 
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的 作用 实际 上 不 仅仅 如 此 。 第 一 ， 联 结 条 件 是 参与 联结 的 两 个 关系 中 所 有 同名 属性 都 分 别 相 
等 。 第 二 ,因为 相等 的 属性 实际 上 表示 两 个 关系 中 同一 个 事物 (由 它们 名 称 的 一 致 性 来 表示 )， 
所 以 没有 必要 把 两 列 都 保留 下 来 。 因 此 、 其 中 一 列 通过 投影 而 消除 。 总 之 ，R 和 S 的 自然 联结 ， 
记 为 RRS， 由 下 面 的 关系 表达 式 来 定义 : 
Tatrlist (Ojoin-cond (R x S)) 

其 中 ， | . 
1) attr-list = attributes (R) U attributes (S) ， 即 用 在 投影 运算 符 中 的 属性 序列 包含 参数 关系 
并 集中 的 所 有 属性 ， 但 去 除 重 复 的 属性 名 。 因 为 删除 了 重复 属性 ， 所 以 没有 必要 对 属性 进行 
重 命名 。 . 

2) 联结 条 件 join-cond 具 有 如 下 形式 : 

R.A, =S4 AND …ANDR.4,=S.4， 

这 里 {41, …, A,} = attributes (R) N attributes (S)。 这 就 是 说 ， 它 是 R 和 S 中 公共 属性 的 列表 。 
注意 ， 自 然 联结 的 符号 省 咯 了 联结 条 件 ， 因 为 条 件 是 隐 含 的 (并 且 是 唯一 的 )， 由 赋予 要 联结 
的 关系 的 属性 名 所 决定 。 

典型 的 使 用 自然 联结 的 例子 是 下 面 的 查询 : 

Tstudid, Profid (TRANSCRIPT >< TEACHING) 
这 里 列 出 了 所 有 选修 过 课程 的 学 生 的 It 和 任课 教授 的 Id。 
为 了 进一步 说 明 自然 联结 和 等 值 联结 的 区 别 ， 比 较 下 面 两 个 表达 式 是 很 有 意义 的 : 
TRANSCRIPT >< TEACHING | 


TRANSCRIPT cong TEACHING 


这 里 等 值 联结 条 件 Cond 是 TRANSCRIPT.CrsCode = TEACHING.CrsCode AND TRANSCRIPT.Semester = 
TEACHING. Semester。 两 个 表达 式 都 是 等 值 联 结 ， 并 且 都 使 用 了 相同 的 联结 条 件 〈 自然 联结 是 
隐 含 使 用 的 )。 然 而 ， 结 果 关 系 却 有 着 不 同 的 属性 集合 。 

自然 联结 

StudId, CrsCode, Semester, Grade, ProfId 

FERH 

StudId, TRANSCRIPT.CrsCode, TEACHING.CrsCode, 


TRANSCRIPT.Semester, TEACHING.Semester, Grade, ProfId - 


两 个 表达 式 实质 上 表示 了 相同 的 信息 。 然 而 ， 等 值 联结 的 模式 多 了 两 个 属性 (它们 是 其 
他 属性 的 重复 ) ， 自 然 联结 的 优势 在 于 有 较 简 单 的 属性 命名 规则 。 
除了 发 现 数据 中 的 隐藏 联系 ， 联 结 还 能 用 于 某 些 计数 任务 。 下 面 的 表达 式 说 明 如 何 找 出 
至 少 选修 两 门 不 同 课程 的 所 有 学 生 : 
Nstudid ( | 
OcrsCode + CrsCode2 ( 
TRANSCRIPT >< 
TRANSCRIPT [Studld, CrsCode2, Semester2, Grade2] 


POW DERI KRAKRPSQL 99 


这 个 技术 的 一 个 明显 的 限制 是 如 果 我 们 想 得 出 选修 了 15 门 课程 的 学 生 ， 那 么 我 们 就 不 得 
不 将 TRANSCRIPT 与 其 自身 联结 15 次 。 一 个 更 好 的 方法 是 扩展 关系 代数 使 之 具有 所 谓 的 聚合 
(aggregate) 函数 ， 其 中 就 有 计数 运算 符 。 我 们 在 这 里 并 不 讨论 这 种 可 能 性 ， 但 是 我 们 将 在 
6.2 节 介绍 SQL 的 内 容 中 再 来 讨论 聚合 函数 。 

谈 到 联结 ， 就 不 能 不 提 到 下 面 这 一 点 一 一 交 运算 是 自然 联结 的 特殊 形式 。 假 设 R 和 S 是 并 
相 容 的 ， 由 定义 可 以 直接 得 到 RnS = R A S. 

2. 除 法 运算 符 

尽管 联结 运算 符 使 查询 回答 具有 一 定 的 智能 性 ， 除 法 运算 符 则 是 最 难以 理解 和 正确 使 
用 的 。 

当 你 很 想 找 出 哪个 教授 讲 疫 计算 机 科学 系 开设 的 所 有 课程 或 者 哪个 学 生 选 修 过 电子 工程 
系 每 个 教授 讲 投 的 课程 ， 那 么 除法 运算 符 就 非常 有 用 了 。 这 里 的 关键 在 于 我 们 想 在 二 个 关系 
中 找 出 匹配 另 一 个 关系 中 所 有 元 组 的 元 组 。 

下 面 是 精确 的 定义 。 假 设 R 是 具有 属性 A1，…, An Bo = Bu 的 关系 模式 ，S 是 具有 属性 
Bi, …, B, 的 关系 模式 。 换 句 话说 ，S 的 属性 集 是 R 的 属性 集 的 一 个 子 集 。R 除 以 S 是 形 如 R/S 的 
表达 式 。 如 果 r 和 s 是 数据 库 中 与 R 和 S 相 对 应 的 关系 实例 ， 那 么 数据 库 中 R/S 的 值 ( 记 为 r/s) 
是 属性 集 为 41, …, 4, 的 关系 ， 它 包含 了 所 有 这 样 的 元 组 <a>: 对 于 s 中 的 每 个 元 组 <b> ， 联 结 后 
的 元 组 <a, b> 在 r 中 。 这 个 定义 的 示意 图 如 图 6-5 所 示 。 


rsp] 





KAS 


x 在 r/s 中 





关系 
图 6-5 除法 运算 符 


定义 除法 的 一 个 等 价 方法 是 ， 
<a> E r/s 当 且 仅 当 {<a>}x s Cr 
因此 ， 如 果 把 x 看 成 是 乘法 ， 那 么 可 以 把 除法 看 成 是 乘法 的 逆 运 算 。 
举 个 例子 ， 考 虑 查询 列 出 计算 机 科学 系 每 个 教授 讲 投 过 的 所 有 课程 。 这 里 的 “每 个 教授 
是 指 “ 记 录 在 数据 库 中 的 每 个 教授 。 也 就 是 说 ， 我 们 假设 数据 库 描 述 了 我 们 所 知道 的 一 切 情 
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况 。 不 仅 数据 库 中 的 每 个 元 组 代表 了 有 关 被 建 模 的 现实 世界 企业 的 一 个 事实 ， 而 且 除 此 之 外 
没有 其 他 已 知事 实 能 表示 成 数据 库 关 系 中 的 元 组 。 这 被 称 为 封闭 世界 假设 (closed-world 
assumption ) ， 隐 含 在 关系 查询 处 理 中 。 

图 6-6 给 出 了 三 个 关系 。 关 系 


PROFCS = mq (Opeptid = 'cs' (PROFESSOR)) 


包含 了 所 有 已 知 的 计算 机 科学 系 教授 的 Id4。 关 系 

PROFCOURSES = (Itprotid, cncede (TEACHING)) [Id, CrsCode] 
是 课程 和 任课 教授 (任何 时 候 ) 之 间 的 一 个 联系 ， 它 包含 了 所 有 已 知 的 这 种 联系 (注意 ， 我 
们 应 用 了 重 命名 运算 符 来 保证 PRoFCoURsEs 的 第 一 个 属性 与 PoFCS 的 属性 同名 )。 第 三 个 关系 
给 出 了 PROFCOURSES/PROFCS， 这 是 查询 的 结果 。 





Id 
101202303 
555666777 


所 有 计算 机 系 教授 : T1a(Opeptrae'cg: (PROFESSOR) ) 


783432188 MGT123 
009406321 MGT123 
121232343 EEi01 
555666777 CS305 
101202303 CS315 
900120450 MAT123 
101202303 CS305 































HATHA: (rprofrd Crscode (TEACHING) ) [Id,CrsCode] 


答案 : ProfCourses/ProfCs | 
图 6-6 查询 剖析 : 每 个 计算 机 科学 系 教授 讲授 过 的 课程 

注意 ， 在 应 用 除法 运算 符 之 前 ， 我 们 小 心地 利用 投影 去 除 某 些 属性 (对 某 些 其 他 的 属性 
进行 了 重 命名 ) 来 使 得 除法 运算 符 是 可 应 用 的 。 在 这 种 情况 下 显然 必须 进行 投影 。 

为 了 说 明 问题 ， 我 们 考虑 下 面 的 查询 : 检索 选修 过 曾 教 过 课 的 每 个 教授 的 课 的 所 有 学 生 。 
被 除数 需要 的 是 一 个 能 联系 学 生 和 在 某 门 课程 中 教 过 他 们 的 教授 的 关系 。 我 们 可 以 通过 
TRANSCRIPT 和 TEACHING 的 自然 联结 得 到 这 个 关系 : l 

STUDPROF = TRANSCRIPT DA TEACHING 
STUPPROF 具 有 属性 Studld、CrsCode、Semester、Grade 和 Profld， 这 些 比 我 们 所 需要 的 信息 多 ， 
所 以 我 们 用 投影 去 掉 不 想 要 的 列 来 得 到 被 除数 : suaa rons (SrupPRoF )。 
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因为 我 们 感 兴趣 的 是 选修 过 “每 个 教 投 ”的 课程 的 学 生 ， 除 数 需要 的 是 一 个 对 “每 个 教 
投 ” 都 有 一 个 元 组 的 关系 。 教 过 课 的 教授 在 TEACHING 关 系 的 元 组 里 都 有 他 们 的 Id。( 我 们 不 想 
在 这 里 使 用 PRoFESsSoR ， 因 为 它 可 能 包含 没有 做 过 任何 教学 工作 的 教授 的 元 组 .) 因此 ， 除 数 
是 rpeond (TEACHING ) ， 我 们 查询 的 答案 是 . 

Tstudid, Profra (STUDPROF) / Ttprofig (TEACHING) (6.1) 

这 里 还 有 一 个 例子 : 找 出 选修 过 计算 机 科学 系 所 有 教授 都 教 过 的 课程 的 所 有 学 生 。 这 里 
需要 两 个 除法 : 1 

(ma Name (STUDENT)) [StudId, Name] >< 

(msuald CrsCode (TRANSCRIPT) / 

((Seproftd, CrsCode (TEACHING)) [Id, CrsCode] / (6.2) 
Tia (Opepuid ='cs' (PROFESSOR)))) 


这 里 的 第 二 个 除法 来 自 图 6-6 中 所 应 用 的 表达 式 ， 它 会 产生 每 个 计算 机 系 教授 讲授 过 的 所 有 课 
程 。 因 此 ， 表 达 式 的 最 后 三 行 定义 了 选修 过 所 有 这 样 课程 的 所 有 学 生 的 Id。 第 一 行 的 自然 联 
结 是 用 来 得 到 这 些 学 生 的 姓名 。 我 们 要 在 联结 之 前 先 对 STupENT 关 系 的 属性 进行 重 命名 。 

我 们 总 结 一 下 ， 除 法 运算 符 如 何 用 其 他 的 关系 运算 符 (投影 、 差 、 又 积 ) 来 表达 。 假 设 R 
是 具有 属性 4，B 的 关系 ，S 是 具有 单一 属性 8 的 关系 (下 面 的 构造 即使 在 4 和 8B 没 有 交集 的 情况 
下 也 是 正确 的 )。 在 不 使 用 除法 的 情况 下 ， 表 达 式 R/S 可 以 计算 如 下 : 

Ti =n (R)x S ”在 R 中 4 的 值 和 S 中 8B 的 值 之 间 所 有 可 能 的 关联 。 

T= (Ti ~ R) ”在 R 中 所 有 那些 不 和 S$ 中 每 个 B 的 值 都 有 联系 的 4 的 值 ， 

这 些 正 好 就 是 那些 不 应 该 出 现在 答案 中 的 4 的 值 。 
T;=m,(R)-T, ， 答案 : 在 R 中 和 S 中 所 有 8 的 值 都 有 联系 的 4 的 值 ， 


6.2 SQL 的 查询 子 语言 


SQL 是 使 用 最 为 广泛 的 关系 数据 库 语言 。1974 年 提出 了 最 初版 本 ， 之 后 发 展演 化 至 今 。 
使 用 最 广泛 的 版 本 通常 称 为 SQL-92, 是 美国 国家 标准 协会 (ANSI) 的 标准 。 语 言 在 继续 演化 ， 
SQL:1999 最 近 也 已 经 完成 。SQL 和 任何 一 种 快速 演化 的 语言 一 样 ， 其 形式 受众 多 用 户 的 影响 ， 
所 以 也 变 得 极其 复杂 了 。 本 节 和 下 一 节 就 是 向 你 介绍 它 的 一 些 复 杂 性 。 但 是 ， 你 应 该 知道 ， 
全 面 阐述 该 语言 足 可 以 写成 一 本 书 。 例 如，[Melton and Simon 1992, Date and Darwen 1997] 是 
有 关 SQL-92 的 详细 介绍 的 参考 书 ，[Gulutzan and Pelzer 1999] 描 述 了 SQL:1999。 然 而 ， 商 业 
数据 库 并 不 总 是 遵守 这 些 标准 ， 与 供应 商 有 关 的 参考 书 几 乎 是 重大 的 应 用 开发 所 必需 的 。 

SQL 可 以 通过 从 终端 向 数据 库 管理 系统 直接 提交 SQL 语句 来 交互 使 用 。 然 而 ， 特 别 是 在 
事务 处 理 系统 中 ，SQL 语 句 通常 伐 入 在 较 大 的 程序 中 ， 在 运行 时 将 其 提交 给 数据 库 管理 系统 ， 
并 处 理 返 回 的 结果 。 有 关 嵌 和 人 的 相关 内 容 将 在 第 10 章 中 讨论 。 


6.2.1 简单 的 SQL 查询 


简单 的 SQL 查询 是 很 容易 设计 的 。 想 要 列 出 电子 工程 (EE) 系 的 所 有 教授 ? 可 以 利用 下 
列 查询 : 


(6.3) 
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SELECT P.Name 
FROM PROFESSOR P 
WHERE P.DeptId = 'EE' 


注意 ， 符 号 P 称 为 元 组 变量 (tuple variable )。 它 的 取 值 范围 是 关系 PROFESSOR 的 元 组 ®。 
实际 上 在 这 个 语句 中 可 以 不 使 用 元 组 变量 。 我 们 同样 可 以 不 在 FROM 子 句 中 使 用 它 ， 把 这 些 
属性 称 为 Name 和 DeptId 即 可 ， 而 不 用 称 为 P.Name 和 P.DeptId， 因 为 这 样 并 不 会 引起 混 消 。 我 
们 也 可 以 使 用 PROFESSOR.Name 和 PROFESSOR.DeptId， 但 是 这 样 就 相当 麻烦 。 不 过 一 旦 引入 了 元 

组 变量 ， 就 不 必 在 语句 中 任何 地 方 使 用 表 的 全 名 了 。 

我 们 很 快 就 会 看 到 ， 在 某 些 情形 下 使 用 元 组 变量 是 很 方便 的 ， 在 某 些 情 形 下 也 是 很 必要 
的 。 所 以 ， 在 SELECT 语句 中 使 用 元 组 变量 是 一 种 很 好 的 编程 习惯 ， 不 会 导致 小 错误 。 因 此 ， 
在 本 书 中 我 们 总 是 声明 所 有 的 元 组 变量 。 

虽然 这 个 语句 非常 简单 ， 但 是 重要 的 是 理解 如 何 计算 SELECT 语 句 。SELECT 语 句 可 能 会 
很 复杂 ， 对 语句 遵循 一 定 的 操作 流程 是 了 解 当前 处 理 进展 的 唯一 方法 。 当 然 ， 不 同 的 数据 库 
管理 系统 可 能 在 计算 同一 个 语句 的 时 候 采 用 不 同 的 策略 ， 但 是 因为 它们 都 产生 相同 的 结果 ， 
所 以 描述 一 种 特别 简单 的 策略 是 很 有 用 的 。 

1. 简单 查询 的 计算 策略 

计算 SQL 查 询 的 基本 算法 可 以 描述 如 下 : 

第 一 步 ， 计 算 FROM 子 句 。 它 产生 一 个 表 ， 这 个 表 是 作为 参数 的 那些 表 的 笛 卡 儿 积 。 如 果 
一 个 表 像 查 询 (6.9) 那样 在 FROM 子 句 中 出 现 多 次 ， 那么 这 个 表 在 积 中 也 会 出 现 相间 的 次 数 。 

第 二 步 ， 计 算 WHERE 子 句 。 它 对 第 一 步 中 产生 的 表 的 每 一 行进 行 单独 处 理 。 行 的 属性 值 
将 替换 条 件 的 属性 名 ， 然 后 计算 这 个 条 件 。 由 WHERE 子 句 产生 的 表 只 包含 那些 条 件 为 真 的 行 

第 三 步 ， 计 算 SELECT 子 句 。 它 利用 第 二 步 中 产生 的 表 ， 只 保留 作 参 数 的 那些 列 ， 
SELECT 语句 输出 结果 表 。 

当 我 们 讨论 SQL 语言 新 的 特点 的 时 候 ， 我 们 将 会 给 这 个 策略 加 上 额外 的 步骤 ， 但 是 基本 
思想 是 不 变 的 。 每 个 子 句 产 生 一 个 表 ， 作 为 下 一 个 要 计算 的 子 句 的 输入 。 在 某 个 计算 中 可 能 
不 需要 某 些 步 又 。 例 如 ， 因 为 SELECT 语句 可 以 没有 WHERE 子 句 ， 所 以 就 有 可 能 不 必 计算 步 
晴 2 了 。 其 他 的 步 又 也 可 能 是 微不足道 的 。 例 如 ， 虽 然 每 个 SELECT 语句 必须 有 FROM 子 句 ， 
但 是 如 果 该 子 句 只 指定 了 一 个 关系 ， 那 么 就 没 必要 做 稍 卡 儿 积 了 ， 关 系 也 只 是 传 给 步骤 2。 

与 上 面 的 SQL 查询 等 价 的 关系 代数 是 

TIName(Gpepud = 'er' (PROFESSOR)) 

结 查询 

KEMARA Z MUR ASS ERNA. 下 面 的 查询 涉及 到 联结 ， 它 返回 

在 1994 年 秋季 授课 的 所 有 教授 的 列表 。 


SELECT P.Name Sa 
FROM PROFESSOR P, TEACHING T . ` (6.4) 
WHERE P.Id = T.ProfId AND T.Semester = 'F1994' 


O ”掌握 SQL 意味 着 要 在 头脑 中 塞 满 宛 余 的 术语 。 例 如 ，SQL 变 量 也 称 作 “ 表 别名 ”。 我 们 将 在 第 7 章 中 看 到 这 
些 变量 对 应 于 元 组 关系 演算 的 元 组 变量 。 关 系 演算 是 SQL 的 真实 理论 基础 。 
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注意 ， 这 个 例子 中 的 元 组 变量 证 清 了 这 个 语句 的 含义， 因为 它们 确定 了 每 个 属性 来 源 于 
哪个 表 。 如 果 PROFESSOR 的 Id 属 性 被 称 为 ProfId， 而 不 是 简单 的 1d， 我 们 就 不 得 不 用 元 组 变量 
来 区 别 这 两 个 引用 。 

语句 的 计算 遵循 上 面 列 出 的 步骤 。 与 前 面 的 例子 相对 比 ， 这 个 例子 处 理 FROM 子 句 时 涉 
RETR ABRIL. 

花 点 时 间 让 自己 确信 这 个 查询 等 价 于 下 面 的 关系 代数 表达 式 。 

TName (PROFESSOR Dig - profiad OSemester = 'F1994 (TEACHING)) (6.5) 
它 把 联结 条 件 和 选择 条 件 区 别 开 来 。 联 结 条 件 Id = ProfId 确 保 组 合 两 个 表 中 相关 的 元 组 。 组 合 
关系 PROFESSOR (描述 了 某 个 特定 的 教授 ) 中 的 元 组 和 关系 TEAcHING (描述 了 由 不 同 的 教授 讲 
授 的 某 门 课 ) 中 的 元 组 是 没有 意义 的 。 因 此 ， 联 结 条 件 消除 了 没有 意义 的 部 分 。 另 一 方面 ， 
选择 条 件 Semester = 'F1994' 消 除了 与 这 个 查询 无 关 的 元 组 。 

3. SQL 和 关系 代数 之 间 的 联系 

TName (jd = Profid AND Semester = Fl994 (PROFESSOR x TEACHING)) 
45 (65) 等 价 ， 但 是 它 不 包含 任何 联结 运算 符 。 事 实 上 ， 它 合并 了 联结 条 件 和 选择 条 件 。 虽 
然 结 果 表 达 式 导致 了 一 个 计算 相应 的 SQL 查询 的 最 低 效 的 方法 ， 但 是 它 简 单 、 一 致 ， 从 语法 
的 角度 来 看 也 更 贴近 于 等 价 的 SQL 语句 。 更 一 般 地 ， 查 询 模板 


SELECT TargetList . 
FROM REL Viu., REL, Vn (6.6) 


WHERE Condition 
基本 上 等 价 于 代数 表达 式 


N TargetList OCondition (REL, xo x REL,) (6.7) 
“基本 上 ”意味 着 还 要 把 Condition 转 换 成 关系 代数 的 形式 。 更 具体 的 ， 考 虑 查询 找 出 在 1995 年 
秋季 开设 的 课程 名 称 以 及 讲授 这 些 课程 的 教授 的 姓名 。 用 SQL 来 表达 的 形式 如 下 所 示 : 
SELECT C.CrsName, P.Name . l 
FROM PROFESSOR P, TEACHING T, COURSE C (6.8) 


WHERE T.Semester = 'F1995' AND 
P.Id = T.ProfId AND T.CrsCode = C.CrsCode 


以 低 效 但 一 致 的 形式 来 表达 上 面 描述 的 代数 表达 式 是 
TersName, Name (Gcondition (PROFESSOR x TEACHING x COURSE)) 

Condition 表 示 WHERE 子 句 的 内 容 (可 以 做 适当 修改 以 适合 关系 代数 )。 

Id = ProfId AND TEACHING.CrsCode = COURSE.CrsCode AND 

Semester = 'F1995' 

4. 自 联结 查询 

让 我 们 回 到 前 面 考虑 的 查询 上 来 ， 找 出 所 有 至 少 选 修 过 两 门 课程 的 学 生 。 我 们 把 它 用 关 
系 代数 表达 为 
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Testuala ( 
OcrsCode + CrsCode2 ( 
TRANSCRIPT D< sudrd = studld 
TRANSCRIPT [StudId, CrsCode2, Semester2, Grade2] 
)) 


注意 ,我们 已 经 把 关系 TRANSCRIPT 和 它 自身 进行 了 联结 。 为 了 在 关系 代数 中 完成 这 一 工 
作 ， 我 们 必须 对 TRANSCRIPT 的 第 二 次 出 现 应 用 重 命名 运算 符 。 在 SQL 中 ， 我 们 必须 在 FROM 子 
名 中 两 次 提 到 TRANSCRIPT 关 系 ， 声 明 这 个 关系 上 的 两 个 不 同 的 变量 。 每 个 变量 将 表示 联结 中 
TRANSCRIPT 的 一 次 出 现 。 


SELECT T1.StudId 
FROM TRANSCRIPT T1, TRANSCRIPT T2 (6.9) 
WHERE T1.CrsCode <> T2.CrsCode AND T1.StudId = T2.StudId 


这 个 查询 中 ， 符 号 < > 是 SQL 中 表示 “不 相等 ”的 方法 。 注 意 ， 我 们 确实 需要 两 个 不 同 的 
元 组 变量 在 TRANSCRIPT 上 使 用 ; 如 果 我 们 只 使 用 一 个 变量 T， 那 么 条 件 T.CrsCode < > 
T.CrsCode 将 永远 也 得 不 到 满足 , .使 得 查询 的 结果 是 空 关系 。 因 此 ， 我 们 无 法 在 不 使 用 元 组 变 
量 的 情况 下 还 能 清楚 地 表达 这 个 查询 。 在 这 个 例子 中 使 用 元 组 变量 是 必需 的 。 

5. 检索 不 同 的 结果 

我 们 从 第 4 章 已 经 知道 关系 是 集合 ， 所 以 不 允许 出 现 重 复元 组 。 然 而 ， 许 多 关系 运算 符 可 
以 产生 多 集 (multiset， 也 就 是 类 似 于 集合 的 对 象 ， 其 中 可 能 包含 同一 元 素 的 多 次 出 现 ) 作为 
计算 的 中 间 结 果 。 例 如 ， 如 果 我 们 从 图 4-5 中 描绘 的 关系 TEAcHING 的 实例 中 去 掉 属性 Semester， 
我 们 将 得 到 一 个 元 组 列表 ， 其 中 包含 <009406321， MGT123> 的 重复 出 现 ， 其 他 元 组 也 一 样 。 
因此 为 了 让 SQL 查询 


SELECT T.ProfId, T.CrsCode 
FROM TEACHING T 


返回 一 个 关系 《关系 数据 模型 是 这 样 要 求 的 ) ， 查 询 处 理 器 必须 对 SELECT 子 句 中 指定 的 投影 
结果 进行 额外 的 一 次 扫描 ， 以 消除 所 有 的 重复 。 在 许多 情况 下 ， 程 序 员 并 不 愿意 为 消除 重复 
付出 代价 。 因 此 ，SQL 的 设计 者 决定 ， 在 默认 情况 下 是 不 消除 重复 元 组 的 ， 除 非 使 用 关键 字 
DISTINCT 显 式 地 要 求 消 除 元 组 。 


SELECT DISTINCT T.ProfId, T.CrsCode (6.11) 
FROM TEACHING T ' 


注意 ， 这 个 查询 没有 WHERE 子 句 ，WHERE 子 名 在 SQL 中 是 可 选 的 。 当 没有 WHERE 子 句 
的 时 候 ， 不 管 FROM 子 句 中 元 组 变量 的 值 是 什么 ，WHERE 条 件 都 被 假设 为 真 。 

虽然 WHERE 子 句 是 可 选 的 ， 但 是 SELECT 子 句 和 FROM 子 句 不 是 可 选 的 。 

6. 注释 

和 各 种 编程 语言 一 样 ， 程 序 员 希 望 用 注释 来 给 查询 加 上 评注 。 在 SQL 中 ,注释 是 以 双 减 
号 (一 一 ) 开头 的 字符 串 ， 以 新 行 结束 。 例 如 ， 


-- An example of SELECT DISTINCT 
SELECT DISTINCT T.ProfId, T.CrsCode ' (6.12) 
FROM TEACHING T --No WHERE clause! 


(6.10) 
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7. WHERE 子 身 中 的 表达 式 

到 目前 为 止 ， WHERE 子 句 中 的 条 件 都 是 属性 和 常数 或 其 他 属性 的 比较 。 对 于 数值 ，SQL 
提供 了 下 面 的 比较 运算 符 : = (相等 )、< > (不 相等 )、> (KF). >= (大 于 等 于 )、< ODF) 
和 <= (小 于 等 于 )。 

所 有 这 些 运 算 符 可 以 应 用 于 数值 ， 也 可 以 运用 于 字符 串 〈 字 符 串 也 可 以 用 LIKE 运 算 符 来 
与 模式 比较 ， 我 们 将 在 后 面 描述 这 一 点 )。 字 符 串 从 左 到 右 按照 字母 顺序 来 比较 。 从 本 书 的 目 
的 出 发 ， 我 们 把 重点 关注 ASCII 符 号 ， 并 假定 比较 两 个 字符 串 时 字符 的 顺序 由 分 配给 这 些 字符 
的 ASCII 代 码 决定 。 

这 些 比较 运算 符 的 运算 项 可 以 是 表达 式 (expression ) ， 而 不 仅仅 是 单个 的 属性 或 常数 。 
对 于 数值 来 说 ， 表 达 式 由 通常 的 运算 符 (*、+ 等 等 ) 组 成 。 对 于 字符 串 来 说 ， 可 以 使 用 连接 
2B All. Plan, 假设 EMPLOYEE 关 系 具有 属性 SSN、BossSSN、LastName、FirstName、Salary。 
下 面 的 查询 

SELECT E.Id 

FROM EMPLOYEE E, EMPLOYEE M 


WHERE £E.BossSSN = M.SSN AND E.Salary > 2 * M.Salary 
AND E.LastName = 'Mc' || E.FirstName- 


1B El PAK eT ARK RHEE “Mc” AIMEE (如 Donald McDonald) 的 职员 。 
8. SELECT 子 名 中 的 表达 式 和 特点 
下 面 将 会 讨论 SELECT 子 句 的 许多 特点 。 在 2.2 节 中 ， 我 们 注意 到 星 号 (*) 表示 FROM 子 
名 中 所 有 关系 的 所 有 属性 的 列表 。 注 意 ， 当 使 用 星 号 的 时 候 ， 如 果 一 个 关系 在 FROM 子 句 中 
出 现 两 次 (或 多 次 )， 那 么 它 的 属性 也 会 出 现 两 次 (或 多 次 )。 例如， 查询 


SELECT * 
FROM EMPLOYEE E, EMPLOYEE M 
和 


SELECT E.SSN, E.BossSSN, E.FirstName, E.LastName, E.Salary, 
M.SSN, M.BossSSN, M.FirstName, M.LastName, M.Salary 
FROM EMPLOYEE E, M 


是 一 样 的 。 

SQL 也 人 允许 表达 式 作为 目标 列表 的 一 部 分 ， 而 不 仅仅 出 现在 WHERE 子 句 中 (这 个 问题 我 
们 已 经 看 到 )。 例 如 ， 假 设 审计 办 公 室 想 要 得 到 职员 和 他 们 直接 上 司 的 薪水 差异 的 列表 。 这 可 
以 用 下 面 的 查询 来 完成 ， 这 里 目标 列表 的 最 后 一 个 元 素 是 表达 式 。 


SELECT E.SSN, M.SSN, M.Salary - E.Salary 
FROM EMPLOYEE E, EMPLOYEE M 
WHERE E.BossSSN = M.SSN 


如 果 上 面 的 查询 是 交互 使 用 的 ,那么 大 部 分 数据 库 管理 系统 会 给 出 一 张 表 ， 这 张 表 的 前 
两 列 标记 为 SSN， 最 后 一 列 根本 没有 标记 。 显 然 ， 这 不 是 很 令 人 满意 的 ， 因 为 它 需 要 用 户 来 
记 住 SELECT 子 句 中 数据 项 的 含义 。 为 了 解决 这 个 问题 ，SQL 人 允许 程序 员 改 变 属性 名 称 并 可 以 
分 配 不 存在 的 名 称 。 这 要 借助 于 关键 字 AS 才 能 得 以 完成 。 例 如 ， 我 们 可 以 用 如 下 方法 修改 前 
面 的 查询 。 
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SELECT E.SSN AS EmplId, 

M.SSN AS MngrId, 

M.Salary - E.Salary AS SalaryDif ference 
FROM EMPLOYEE E, EMPLOYEE M 
WHERE E.BossSSN = M.SSN 


这 个 查询 除了 输出 的 形式 外 ， 其 他 方面 都 与 前 面 的 查询 相同 。 最 后 一 个 查询 的 属性 将 会 
给 显示 为 Emplld、 Mngrld#iSalaryDifference. 

9. 否定 

WHERE 子 句 的 任何 条 件 都 可 以 用 NOT 来 取 非 。 例 如 ， 在 查询 (6.9) 中 我 们 可 以 用 NOT 
(T1.CrsCode = T2.CrsCode) 来 灰 换 T1.CrsCode < > T2.CrsCode。 取 非 的 条 件 不 需要 是 原子 的 ， 
即 它 可 以 包含 任意 个 由 AND 或 OR 连 接 的 子 条 件 ， 甚 至 可 以 像 下 面 的 例子 中 那样 能 套 使 用 
NOT. 


NOT (E.BossSSN = M.SSN AND E.Salary > 2 * M.Salary 
AND NOT (E.LastName = 'Mc'|| E.FirstName)) 


6.2.2 集合 运算 
SQL 使 用 关系 代数 中 的 集合 运算 符 。 下 面 有 一 个 简单 的 查询 ， 它 用 到 了 集合 运算 符 : 找 
出 所 有 在 计算 机 科学 系 或 电子 工程 系 工作 的 教授 。 


(SELECT P.Name 

FROM PROFESSOR P 

WHERE P.DeptId = 'CS' ) 

UNION (6.13) 
(SELECT P.Name 

FROM PROFESSOR P 

WHERE P.DeptId = 'EE’ ) 


SQL 的 表示 是 自 解释 的 。 查 询 包含 两 个 子 查询 : 一 个 查询 检索 出 所 有 计算 机 科学 系 的 教 
授 ， 另 一 个 查询 检索 出 所 有 电子 工程 系 的 教授 。 它 们 的 结果 使 用 代数 中 的 UNION 运 算 符 合并 
到 一 个 关系 中 。 

虽然 这 个 例子 说 明了 集合 运算 符 在 SQL 中 的 基本 用 法 ， 但 是 在 这 里 使 用 UNION 的 优势 并 
不 明显 。 这 个 查询 不 用 UNION 就 可 以 改写 为 更 加 有 效 的 形式 。 


SELECT P.Name 、 
FROM PROFESSOR P (6.14) 
WHERE P.DeptId = 'CS' OR P.DeptId = 'EE' 


-下 一 个 例子 是 查询 找 出 所 有 计算 机 科学 系 的 教授 和 曾经 教 过 计算 机 科学 课程 的 教授 ， 该 
查询 更 加 复杂 ， 集 合 运算 符 的 优势 也 就 更 为 明显 了 。 

假定 所 有 计算 机 科学 课程 的 代码 都 是 以 CS 开头 。 在 设计 查询 的 时 候 ， 我 们 需要 根据 字符 
串 《 课 程 代 码 ) 来 匹配 模式 。 为 了 检验 一 个 字符 串 是 否 匹 配 一 个 模式 ，SQL 提 供 了 LIKE 谓 词 。 
例如 ，T.CrsCode LIKE 'CS%' 检 验 T.CrsCode 的 值 匹 配 以 CS 开头 并 且 还 可 以 有 零 个 或 多 个 额外 
字符 的 模式 。SQL 的 模式 类 似 于 UNIX 或 DOS 中 的 通配符 ， 但 是 SQL 中 建立 模式 的 方法 有 限 : 
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除了 %， 还 有 _， 它 可 以 和 任意 的 某 个 字符 匹配 2 。 

如 果 不 用 UNION 运 算 符 ， 可 以 用 如 下 方法 找 出 计算 机 科学 系 教授 或 那些 教 过 计算 机 科学 
课程 的 教授 : 

SELECT P.Name 

FROM PROFESSOR P, TEACHING T 

WHERE (P.Id = T.ProfId AND T.CrsCode LIKE 'CS%') 

OR (P.DeptId = 'CS') 

我 们 看 到 ， 当 WHERE 条 件 变 得 较 长 较 复杂 的 时 候 ， 它 就 变 得 比较 难 读 和 理解 了 。 有 了 
UNION 运 算 符 ， 我 们 可 以 用 下 面 的 方法 重 写 这 个 查询 : 

(SELECT P.Name 

FROM PROFESSOR P, TEACHING T 

WHERE P.Id = T.ProfId AND T.CrsCode LIKE 'CS%') 

UNION ` 

(SELECT P.Name 


FROM PROFESSOR P 
WHERE P.DeptId = 'CS') 


尽管 这 个 查询 并 不 比 (6.15) 简洁 ， 但 是 它 更 加 模块 化 ， 也 更 加 容易 理解 。 

如 果 我 们 想 改变 我 们 的 查询 来 检索 所 有 教授 计算 机 课程 但 不 是 计算 机 系 的 教授 的 人 ， 我 
们 可 以 简单 的 修改 (6.16): 用 EXCEPT 替 换 UNION， 这 里 EXCEPT 是 关系 代数 中 减法 运算 符 
对 应 的 SQL 名 称 。 把 (6.15) 改 为 新 的 查询 比较 微妙 : (6.15) 的 WHERE 子 句 要 改 成 

P.Id = T.ProfId AND T.CrsCode LIKE 'CS%' AND P.DeptId <> 'CS' 

继续 集合 运算 符 的 讨论 ， 假 设 我 们 需要 找 出 所 有 既 选 修 过 “事务 处 理 ” 课 程 (CS315), 
又 选修 过 “数据 库 系 统 ”课程 (CS305) 的 学 生 。 首 先 ， 我 们 可 能 构造 下 面 的 查询 : 


SELECT S.Name A 

FROM STUDENT S, TRANSCRIPT T l (6.17) 

WHERE S.StudId = T.StudId AND T.CrsCode = 'CS305' i . 
AND T.CrsCode = 'CS315' 


然而 ， 再 细致 地 检查 一 下 ， 我 们 就 会 发 现 这 个 SQL 查询 并 不 是 我 们 所 需要 的 ， 因 为 它 要 求 在 
TRANSCRIPT 中 有 一 个 元 组 能 使 T.CrsCode 既 等 于 CS305 又 等 于 CS315， 而 这 是 不 可 能 的 。 这 个 
简单 的 例子 说 明了 一 个 常见 的 错误 ， 即 没有 认识 到 需要 使 用 另 一 个 元 组 变量 。 针 对 我 们 的 问 
题 ， 正确 SQL 查 询 是 有 z5 | 


SELECT S.Name 
FROM STUDENT S, TRANSCRIPT T1, TRANSCRIPT T2 (6.18) 
WHERE $.StudId = Ti.StudId AND T1.CrsCode = ‘CS305' 

AND S.StudId = T2.StudId AND T2.CrsCode = 'CS315' 


注意 ， 我 们 用 了 关系 TRANSCRIPT 上 的 两 个 不 同 的 元 组 变量 来 表达 学 生 S 选 修 过 两 门 不 同 课程 的 
事实 。 i 


(6.15) 


(6.16) 


日 ”假设 你 要 构造 一 个 模式 ， 其 中 的 特殊 字符 % 和 -_ 就 表示 它们 自己 。 例 如 ， 假 设 你 需要 匹配 以 “_%” 开 头 的 
所 有 字符 串 。 这 是 可 以 完成 的 ， 虽 然 有 些 麻 烦 : 你 必须 先 声明 一 个 转 义 字符 ， 然 后 把 它 作为 特殊 字符 的 前 
组， 来 让 SQL 知 道 这 些 字符 表示 它们 自己 。 例 如 ，C.Descr LIKE \\%__$' ESCAPE W 把 C.Desct 的 值 和 下 
面 的 匹配 字符 串 的 模式 做 比较 : 以 “_%” 开 头 ,跟着 一 对 任意 字符 ， 最 后 以 符号 $ 结 尾 。 这 里 通过 
ESCAPE 子 句 把 “\” 声 明 为 转 义 字符 ,然后 用 来 转 义 “%” 和 “_”。 
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这 和 最 初 的 话题 一 一 关系 代数 中 的 集合 运算 符 有 什么 关系 呢 ? 原来 ，INTERSECT 运 算 符 
让 我 们 可 以 用 一 种 更 为 模块 化 更 不 易 出 错 的 方式 来 重 写 (6.18). 


(SELECT S.Name 

FROM STUDENT S, TRANSCRIPT T 

WHERE S.StudId = T.StudId AND T.CrsCode = 'CS305') 

INTERSECT (6.19) 
(SELECT S.Name 

FROM STUDENT S, TRANSCRIPT T 

WHERE S.StudId = T.StudId AND T.CrsCode = 'CS315') 


注意 ， 我 们 这 里 并 不 需要 在 同一 个 关系 上 安排 多 个 变量 ， 这 稍微 减少 了 一 些 出 错 的 危险 。 
实际 上 我 们 写 了 两 个 很 简单 ， 但 本 质 上 又 很 类 似 的 查询 ， 然 后 取 了 它们 结果 的 交集 。 

1. 集合 构造 器 

最 后 我 们 介绍 一 个 相关 的 特点 ， 即 在 SQL 查询 中 能 够 构造 有 限 集 合 的 构造 器 。 集 合 构造 
器 的 语法 很 简单 : (set-elem,, setrelem2，…, sel-elem,)。 运 算 符 IN 让 我 们 可 以 检查 一 个 特定 的 
元 素 是 否 在 这 个 集合 里 。 例 如 ， 借 助 于 集合 构造 器 可 以 把 查询 (6.14) 简化 为 


SELECT P.Name 
FROM PROFESSOR P (6.20) 
WHERE P.Deptid IN ('CS','EE') 


注意 ， 如 果 我 们 把 查询 (6.17) 的 WHERE 子 句 替换 成 

S.StudId = T.StudId AND T.CrsCode IN ('CS305','CS315' ) 

我 们 得 到 一 个 含义 不 同 于 (6.17) 的 查询 。 这 个 问题 将 在 练习 6.13 中 作 进 一 步 研究 。 

2. 否定 和 中 缓 比较 运算 符 | 

之 前 我 们 讨论 过 NOT 运 算 符 。 对 于 一 些 像 LIKE 和 IN 这 样 的 中 缀 运算 符 ，SQL 提 供 了 两 种 
形式 的 否定 : NOT (X LIKE Y) 和 与 之 等 价 的 X NOT LIKE Y。 类 似 地 ， 可 以 把 NOT (XIN 
Y) 写成 X NOT IN Y。 


6.2.3 REA 


如 果 完 成 每 个 任务 就 只 有 一 种 方法 ， 那 么 就 先 去 了 使 用 SQL 的 乐趣 。 考 虑 查询 选择 所 有 
在 1994 年 秋季 授课 的 教授 。(6.4) 给 出 了 以 SQL 表示 的 一 种 方法 ， 但 是 (Eb) 还 有 一 种 完 
全 不 同 的 方法 : BREF REM (nested subquery) 计算 出 在 1994 年 秋季 授课 的 所 有 教授 的 
集合 ， 然 后 提取 他 们 的 名 字 。 


SELECT P.Name 
FROM PROFESSOR P 
WHERE P.Id IN 
-- A nested subquery 
(SELECT T.ProfId 
FROM TEACHING T 
WHERE T.Semester = 'F1994') 


注意 ， 在 这 个 例子 中 ， 伐 套子 查询 只 计算 一 次 ， 然 后 根据 此 计算 结果 在 WHERE 子 句 的 条 件 中 
检验 PROFESSOR 的 每 一 行 。 . | 
上 面 的 例子 说 明了 嵌 套 子 查 询 的 一 个 优势 ， 即 增加 了 可 读 性 。 然 而 ， 仅 仅 能 够 增加 可 读 





POX HERI: KKAKRMAPSOL 109 


性 并 不 能 成 为 使 用 它 的 充足 理由 ， 因 为 大 多 数 的 查询 处 理 器 不 能 很 好 地 优化 嵌 套 子 查询 。 使 
用 雹 套子 查询 的 主要 原因 是 它 增 强 了 SQL 的 表达 能 力 ， 没 有 嵌 套 子 查询 ， 一 些 查询 就 不 能 通 
过 自然 的 方式 表达 出 来 。 | 

考虑 查询 列 出 没有 选修 过 任何 课程 的 所 有 学 生 。 这 个 查询 听 起 来 很 简单 ， 但 是 在 SQL 中 
不 用 储 套 子 查询 (或 者 EXCEPT 语 句 ， 可 以 自己 试 试 在 SQL 中 使 用 EXCEPT 语 句 ) ， 它 就 不 能 
表达 出 来 。 


SELECT S.Name 
FROM STUDENT S 
WHERE S.Id NOT IN 
-- Students who have taken a course 
(SELECT T.StudId 
FROM TRANSCRIPT T) 


(6.21) 


作为 最 后 一 个 例子 ， 子 查询 可 以 用 于 从 一 张 表 中 析 取 出 标量 值 。 假 设 你 想 知道 哪个 职员 
的 薪水 比 你 高 (你 的 1d 是 111111111)， 你 可 以 用 子 查询 从 EMPLOYEE 中 得 到 你 的 薪水 值 : 
SELECT E.Id 
FROM EMPLOYEE E 
WHERE E.Salary > 
(SELECT E1.Salary 
FROM EMPLOYEE Ei 
WHERE El.Id = '111111111') 


上 面 的 查询 就 可 以 找 出 薪水 比 你 高 的 所 有 职员 。 

1. 相关 嵌 套 子 查询 

一 方面 ， 嵌 套子 查询 可 以 提高 查询 的 可 读 性 。 另 一 一 方面 ， 它 也 是 SQL 中 最 复杂 、 最 昂贵 、 
最 容易 出 错 的 特性 之 一 。 这 个 复杂 性 从 很 大 程度 上 来 说 要 归 因 于 查询 相关 性 (query 
correlation ) ， 即 在 外 层 查 询 中 定义 变量 ， 在 内 层 查 询 中 使 用 它们 的 能 力 。 fe BE FAH KE PEARL 
于 编程 语言 中 begin/end 块 的 概念 和 变量 的 作用 域 的 相关 思想 。 

为 了 进行 说 明 ， 我 们 假设 需要 找 出 为 在 下 一 个 学 期 (为 了 明确 起 见 ， 比方 说 是 1999 年 秋 
季 ) 计划 教 课 的 教授 做 助教 的 学 生 。 对 于 每 个 教授 ， 我 们 计算 出 他 在 那个 学 期 要 教授 的 所 有 
课程 的 集合 ， 然 后 找到 选修 其 中 一 门 课程 的 学 生 (也 就 有 资格 做 助教 ). TORE TEE 
计算 教授 所 教 的 课程 的 列表 ， 在 外 层 查 询 里 把 教授 与 做 助教 的 学 生 联 系 起 来 。 下 面 是 这 个 计 
划 在 SQL 中 的 实现 : 


SELECT R.StudId, P.Id, R.CrsCode ` 
FROM TRANSCRIPT R, PROFESSOR P 
WHERE R.CrsCode_ IN . 
~- Courses taught by P . Id in F1999 
(SELECT T1.CrsCode 
FROM TEACHING Ti 
WHERE T1.ProfId = P.Id AND T1. Semester = 'F1999， ) 


这 里 ， 变 量 T1 的 作用 域 被 限制 在 子 查 询 中 。 相 反 ， 变量 P 在 外 层 查 询 和 内 层 查 询 中 都 是 可 
见 的 。 这 个 变量 是 内 层 查 询 的 参数 ， 并 把 它 的 结果 和 外 层 查询 的 元 组 相关 。 也 就 是 说 ， 对 于 
每 个 PId 值 ， 独 立 计算 内 层 查询 就 好 像 PId 是 常数 一 样 。 每 次 计算 内 层 查询 时 ， 将 根据 返回 的 
结果 检查 R.CrsCode 的 值 。 如 果 这 个 值 属于 这 个 结果 ， 则 外 层 的 SELECT 查询 就 形成 输出 元 组 。 


(6.22) 
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HER, AAEL PRoressorMe—-THRRitA. KEMPAKVRERAMRN, 
也 解释 了 与 查询 相关 有 关 的 代价 。. 1 
即使 嵌 套 查询 对 于 查询 优化 器 来 说 是 一 种 挑战 ， 但 没有 经 验 的 数据 库 程 序 员 有 时 会 滥用 
它们 ， 不 使 用 比较 简单 的 AND、NOT 等 而 是 用 储 套 查询 替代 它们 。 这 里 有 一 个 例子 ， 说 明 如 
何不 写 前 面 的 查询 (即使 它 在 语义 上 也 是 正确 的 ) 而 使 用 可 以 完成 相同 功能 的 另 一 个 查询 : 
SELECT R.StudId, T.ProfId, R.CrsCode 
FROM TRANSCRIPT R, TEACHING T 
WHERE R.CrsCode IN 
-- Courses taught by T.ProfId in F1999 
(SELECT T1.CrsCode 
FROM TEACHING T1 
WHERE T1.ProfId = T.ProfId AND 
-- Bad style: unreadable and slow! 
T1.ProfId IN (SELECT T2.ProfId 
FROM ‘TEACHING T2 
WHERE T2.Semester = 'F1999' ) ) 
2. EXISTS: # # 
RERKETRAEGKRABERETOLEN. Plan, PAR OA A Rt it 
ey 解决 这 个 问题 的 一 种 途径 是 计算 一 个 学 生 选 修 的 所 有 计算 机 课程 的 集合 ， 然 
只 列 出 这 个 集合 为 空 的 那些 学 生 。 这 可 以 借助 于 相关 符 套 子 查询 和 EXISTS 运 算 符 来 完成 ， 
RR pee ei. 
下面 是 这 个 查询 的 SQL 表示 : 


SELECT S.Id 
FROM . STUDENT S 
WHERE NOT EXISTS ( ue 
--_All CS courses taken by S.Id 
SELECT T.CrsCode (6.23) 
FROM TRANSCRIPT T ` l 
WHERE T. CrsCode. LIKE 'CS%' 
AND T. Studd: =S.Id) . 


相对 于 内 层 子 查询 来 说 变量 S 是 全 局 的 。 对 于 SJd 的 每 个 值 (在 计算 过 程 中 被 视 为 常数 ) 
计算 这 个 子 查询 。 内 层 查 询 没有 结果 的 所 有 Sd 值 构成 外 层 查询 的 结果 。 

3. 表达 除法 运算 符 

我 们 现在 来 说 明 舱 套 查询 有 助 于 表达 关系 除法 运算 符 。 有 具体 来 说 ， 考虑 查询 列 出 选修 过 
所 有 计算 机 课程 的 所 有 学 生 。 我 们 可 以 通过 首先 计算 一 门 计算 机 课程 对 应 一 行 的 单 属性 关系 
(这 是 除法 运算 符 的 被 除数 ) 来 解决 这 个 问题 。 然 后 ， 对 于 每 个 学 生 ， 我 们 检查 这 个 学 生 的 成 
绩 单 是 否 包 含 了 所 有 这 些 课程 。 

为 了 使 思路 更 加 清晰 ， 我 们 首先 用 虚拟 的 SQL (一 种 与 SQL 不 同 的 不 存在 的 语言 ， 因 为 
它 有 一 个 额外 的 集合 运算 符 CONTAINS ) 来 实现 我 们 的 计划 。 


SELECT S.Id 

FROM STUDENT S 

WHERE ~~ All courses taken by S. Id 
(SELECT R.CrsCode 
FROM TRANSCRIPT R 
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WHERE R.StudId = S.Id ) 
CONTAINS 

-- All CS courses 

(SELECT C.CrsCode 

FROM Course C 

WHERE C.CrsCode LIKE 'CS%' ) 


这 个 过 程 看 起 来 很 简单 ， 只 是 现实 的 SQL 缺少 CONTAINS。 然 而 ， 因 为 4 CONTAINS 8 等 
价 于 NOT EXISTS (B EXCEPT 4)， 所 以 这 个 问题 是 能 够 解决 的 。 但 是 上 面 查询 的 真正 的 
SQL 表示 看 起 来 就 复杂 得 多 了 。 i 


SELECT S.Id 
FROM STUDENT S 
WHERE NOT EXISTS ( 
(SELECT C.CrsCode 
FROM COURSE C 
WHERE C.CrsCode LIKE 'CS%' ) 
EXCEPT 
(SELECT R.CrsCode 
FROM TRANSCRIPT R 
WHERE R.StudId = S.Id ) ) 


下 面 是 一 个 更 复杂 的 查询 : 
找 出 选修 过 计算 机 科学 系 每 个 教授 教 过 的 课程 的 所 有 学 生 。 
产生 这 个 查询 结果 的 SQL 语句 是 ; 


SELECT S.Id 
FROM STUDENT S 
WHERE 
NOT EXISTS ( 
-- CS professors who did not teach S.1d 
(SELECT P.Id -- All CS professors 
FROM PROFESSOR P 
WHERE P.Dept = 'CS') 
EXCEPT 1 (6.24) 
(SELECT T.ProfId -- Professors who have taught S. Ia 
FROM TEACHING T, TRANSCRIPT R 
WHERE T.CrsCode = R.CrsCode 
AND T.Semester = R.Semester 
AND S.Id = R.StudId) ) 


变量 S 是 全 局 的 ， 每 次 计算 子 查询 的 时 候 ，S 的 值 是 固定 的 。 另 一 方面 ，R 的 范围 是 
TRANSCRIPT 的 所 有 元 组 。 因 此 ，R.Semester 和 R.CrsCode 的 值 取 自学 生 S$S.Id 的 所 有 注册 记录 ， 
T.Proftd 的 取 值 范围 是 所 有 教 过 SId 的 所 有 教授 。 

4. 集合 比较 运算 符 

假设 STUDENT 关 系 有 另外 一 个 数值 属性 GPA 。 我 们 可 以 提出 这 样 的 查询 : 大 学 里 是 否 有 一 
个 学 生 的 GPA 高 于 所 有 大 三 的 学 生 。 o 

FREESE iid ERIK TT RA MH. 


SELECT S.Name, S.Id 

FROM STUDENT S 

WHERE S.GPA >ALL (SELECT S.GPA (6.25) 
FROM STUDENT S 
WHERE S.Status ='junior') 
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这 里 “> ALL” 是 比较 运算 符 , 如 果 它 左边 的 参数 大 于 它 右边 的 集合 中 的 每 个 元 素 的 时 候 ， 
它 返回 真 值 。 如 果 我 们 把 它 替 换 成 “>=ANY”， 我 们 得 到 一 个 查询 ， 它 检索 出 GPA 高 于 或 等 
于 某 个 大 三 学 生 的 学 生 。 

关于 这 个 查询 还 有 一 点 需要 注意 : 在 外 层 查询 和 内 层 查 询 中 都 声明 了 变量 S。 那 么 内 层 查 
询 的 WHERE 子 句 中 提 到 的 是 哪 一 个 S? 答案 是 就 像 begin/end 块 一 样 ， 内 层 的 声明 在 内 层 查询 
中 是 有 效 的 然而， 这 样 的 声明 是 不 好 的 编程 习惯 )。 

5. FROM -F 4) REF Sig 

即使 查询 (6.24) 并 不 是 很 复杂 ， 但 SQL 也 有 藏 而 待 用 的 方法 : 你 可 以 在 FROM 子 句 中 使 
ARETE! 它 是 按 如 下 方式 工作 的 : 你 编写 一 个 嵌 套 子 查询 ( 它 不 能 是 相关 的 ， 因 此 不 
能 用 全 局 变量 )。 这 个 子 查 询 可 以 用 在 FROM 子 句 中 ， 就 好 像 它 是 关系 名 一 样 。 你 可 以 用 关键 
字 AS 来 给 它 附加 一 个 元 组 变量 。( 实际 上 在 这 里 ，AS 是 可 选 的 ， 但 是 为 了 提高 可 读 性 还 是 建 
议 使 用 它 。) 

举 个 例子 ， 我 们 可 以 表达 类 似 于 (6.24) 的 查询 ， 但 是 不 用 NOT EXISTS (也 就 是 说 ， 答 
案 包 含 了 至 少 没有 被 一 个 计算 机 系 教授 教 过 的 所 有 学 生 )， 它 是 通过 把 第 一 个 侯 套 子 查询 移 进 
FROM 子 句 来 实现 的 (不 能 移动 第 二 个 子 查询 ， 因 为 它 是 相关 的 )。 


SELECT S.Id 
FROM STUDENT S, l 
(SELECT P.Id -- All CS professors 
FROM PROFESSOR P 
WHERE P.Dept = 'CS') AS C 
WHERE C.ProfId NOT IN (6.26) 
(SELECT T.ProfId -- AllS.Id’s professors 
FROM TEACHING T, TRANSCRIPT R 
WHERE T.CrsCode = R.CrsCode 
AND T.Semester = R.Semester) 
AND S.Id = R.StudId ) 


应 该 尽 可 能 避免 在 FROM 子 句 中 使 用 侯 套 子 查询 ， 因 为 它 可 能 产生 作者 自己 也 难以 理解 
和 检验 的 查询 。 一 个 更 好 的 替代 方法 是 使 用 视图 机 制 ， 这 将 在 6.2.6 节 中 讨论 。 
除了 傣 套 查询 外 ，SQL 也 允许 在 FROM 子 句 中 出 现 显 式 的 表 联结 。 然 而 ， 我 们 不 讨论 这 个 


”6.2.4 数据 的 聚合 


在 许多 情况 下 ， 需 要 计算 平均 工资 、 最 高 GPA、 每 个 部 门 的 员工 人 数 、 总 的 购买 金额 等 
等 。 可 以 借助 运算 在 元 组 集合 上 的 所 谓 的 聚合 函数 (aggregate function) 完成 这 些 任 务 。SQL 
使 用 图 6-7 所 示 的 5 个 聚合 函数 。 

聚合 函数 不 能 用 纯粹 的 关系 代数 来 表示 。 然 而 ， 可 以 扩展 代数 来 使 用 它们 (这些 扩展 超 
. 过 了 本 书 的 讨论 范围 )。 

为 了 说 明 聚 合 函 数 的 使 用 ， 假 设 STupENT 和 PRoFESSOR 关 系 都 有 属性 Age，STUDENT 关 系 还 
有 属性 GPA。 我 们 先 来 看 一 些 简单 的 例子 。 


-- Average age of the student body 
SELECT AVG(S. Age) 
FROM STUDENT S 
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-- Minimum age among professors in the management department 
SELECT MIN(P. Age) 

FROM PROFESSOR P 

WHERE P.DeptId = 'MGT' 


COUNT ([DISTINCT] Attr) 统计 查询 结果 Attr 列 中 值 的 数目 。 可 选 的 关键 字 DISTINCT 指 明 
每 个 值 即 使 在 不 同 的 结果 元 组 中 出 现 多 次 ， 也 只 能 统计 一 次 
SUM (DISTINCT] attr) 累加 Attr 列 的 值 。DISTINCT 意 味 着 每 个 值 不 管 在 Attr 列 中 出 现 多 


少 次 ， 也 只 能 累加 一 次 


AVG (DISTINCT] attr) 计算 Attr 列 值 的 平均 值 。DISTINCT 意 味 着 每 个 值 只 能 用 一 次 
MAX (Attr) 计算 Attr 列 的 最 大 值 。DISTINCT 不 用 于 这 个 函数 ， 因 为 它 对 结 
果 不 产生 影响 
MIN (Attr) 计算 Attr 列 的 最 小 值 。DISTINCT 不 用 于 这 个 函数 


113 





图 6-7 SOLR AAR 


上 面 的 查询 只 是 找 出 平均 年 龄 和 最 小 年 龄 ， 而 不 是 找 出 与 这 些 年 龄 对 应 的 人 。 如 果 我 们 


要 找 出 管理 系 最 年 轻 的 教授 ， 我 们 可 以 用 庙 套 子 查询 。 


-- Youngest professor(s) in the management department 
SELECT P.Name, P.Age 
FROM PROFESSOR P 
WHERE P.DeptId = 'MGT' AND 
P,Age = (SELECT MIN(P1. Age) 
FROM PROFESSOR P1 
WHERE P1.DeptId = 'MGT' ) 


查询 (6.25) 返回 GPA 最 高 的 大 三 学 生 的 名 字 和 Id (前 面 的 查询 中 没有 使 用 聚合 ) ， 也 可 


以 用 MAX 以 另外 一 种 方式 编写 这 个 查询 : 


SELECT S.Name,S.StudId 

FROM STUDENT 8 

WHERE S.GPA >= (SELECT MAX(S1.GPA) 
FROM STUDENT Si 
WHERE S1.Status = 'Junior') 


在 聚合 函数 中 使 用 DISTINCT 有 时 会 在 查询 语义 上 产生 细微 的 差别 。 例 如 ， 


SELECT COUNT(P.Name) 
FROM PROFESSOR P 
WHERE P.DeptId = 'MGT' 


返回 管理 系 的 教授 和 人数。 另 一 方面 ， 


SELECT COUNT(DISTINCT P.Name) 
FROM PROFESSOR P 
WHERE P.DeptId = 'MGT' 


返回 管理 系 不 同姓 名 教授 的 人 数 ， 而 这 可 能 与 教授 的 实际 人 数 不 相 符 。 类 似 地 ， 


SELECT AVG(P.Age) 
FROM PROFESSOR P 
WHERE P.DeptId = 'MGT' 


(6.27) 


(6.28) 


(6.29) 


返回 管理 系 教授 的 平均 年 龄 。 然 而 ， 如 果 我 们 在 上 面 的 SELECT 子 句 中 用 AVvG (DISTINCT 
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P.Age)， 查 询 结果 就 是 不 同年 龄 的 平均 年 龄 ， 这 在 统计 上 是 没有 意义 的 。 
我 们 已 经 看 到 利用 聚合 函数 的 一 些 优势 ， 那 么 你 也 应 该 避免 聚合 函数 的 一 些 缺 点 。 在 
SELECT 列表 中 混合 使 用 聚合 国 数 和 属性 是 没有 意义 的 ， 比 如 


SELECT COUNT(*), S.Id 
FROM STUDENT S$ ` (6.30) 
WHERE S.Name = 'JohnDoe' 


这 是 因为 聚合 函数 为 与 John Doe 相 应 的 行 的 整个 集合 产生 单个 值 ， 而 属性 S.Id 为 每 一 行 产 生 一 
个 不 同 的 值 (注意 : 可 能 有 好 几 个 人 叫 John Doe)。 然 而 ， 在 一 些 情况 下 这 样 的 关联 借助 于 稍 
后 将 定义 的 GROUP BY 结构 可 能 会 变 得 有 意义 。 

尽管 在 SELECT 子 名 中 混合 聚合 函数 和 属性 通常 并 不 十 分 有 用 ， 但 是 具有 多 个 聚合 函数 确 
实 是 有 意义 的 。 比 如 ， 


SELECT COUNT(*), AVG(P.Age) 
FROM STUDENT S$ (6.31) 
WHERE S.Name = 'JohnDoe' 


统计 了 在 学 生 关系 中 叫 John Doe 的 入 数 ， 也 计算 了 他 们 的 平均 年 龄 。 最 后 ， 你 可 能 很 想 把 语 
名 (6.27) BEA 


SELECT S.Name,S.StudId 

FROM STUDENT S 

WHERE S.GPA >= (MAX(SELECT S1.GPA 
FROM STUDENT S1 f 
WHERE S1.Status = 'junior')) 


但 是 你 不 敢 这 样 做 ， 因 为 它 是 一 个 无 效 的 构造 器 。 在 WHERE 子 句 中 不 允许 使 用 聚合 函数 。 

聚合 和 分 组 | 

到 现在 为 止 ， 我 们 知道 了 如 何 统计 管理 系 教授 的 人 数 。 但 是 如 果 我 们 想 要 知道 大 学 里 
每 个 系 的 教授 的 人 数 ， 该 怎么 办 呢 ? 当然 ， 我 们 可 以 为 每 个 系 构 造 类 似 于 (6.28) 的 查询 。 
除了 WHERE 条 件 中 的 MGT 将 被 其 他 系 的 代码 替换 以 外 ， 每 个 查询 都 将 是 一 样 的 。 显 然 ， 
这 并 不 是 可 行 的 解决 方法 ， 因 为 即使 在 中 等 规模 的 大 学 里 ， 系 的 数目 也 能 达到 几 十 个 。 另 
外 ， 每 次 成 立新 系 的 时 候 ， 我 们 要 构造 新 的 查询 ， 当 系 改 名 的 时 候 ， 我 们 要 做 乏味 的 维护 
IW. : | 

更 好 的 解决 方法 是 使 用 GROUP BY 子 句 ， 它 可 以 作为 SELECT 语句 的 一 个 组 成 部 分 。 这 
个 子 句 克 许 程序 员 把 行 的 集合 分 成 若干 组 ， 同 一 组 中 的 所 有 行 在 某 个 特定 的 列 的 子 集 上 的 值 
是 一 致 的 。 对 组 应 用 聚合 函数 ， 如 图 6-8 所 示 每 一 组 产生 一 行 。 例 如 ， 如 果 我 们 基于 列 StudId 
把 图 4-5 所 示 的 关系 TRANSCRIPT 的 实例 分 组 ， 结 果 产 生 了 五 个 组 。 在 任何 一 个 指定 的 组 中 ， 所 
有 行 在 StudId 列 上 具有 相同 的 值 ， 但 是 在 其 他 列 上 的 值 可 能 是 不 同 的 。 

例如 ， 下 面 的 查询 


SELECT T.StudId, COUNT(*) AS NumCrs, 
AVG(T.Grade) AS CrsAvg 

FROM TRANSCRIPT T 

GROUP BY T.StudId 
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产生 表 


666666666 
987654321 
123454321 
023456789 
111111111 


这 里 给 出 了 如 何 得 到 每 个 系 的 教授 人 数 和 他 们 的 平均 年 龄 的 方法 。 


SELECT P.DeptId, COUNT(P.Name) AS DeptSize, 
AVG(P.Age) AS AvgAge 

FROM PROFESSOR P 

GROUP BY P.DeptId 





3.33 
2.5 
3.33 
3.5 

















GROUP BY 在 行 的 GROUP 
列表 中 的 属性 BY 列表 上 的 聚合 


同一 组 中 的 所 有 行 在 
GROUP BY GROUP BY 列表 的 所 
列表 中 的 属性 有 属性 上 是 一 致 的 


图 6-8 GROUP BY 子 句 的 作用 


在 这 两 个 查询 中 要 注意 的 一 个 重要 的 问题 是 ，SELECT 子 句 中 的 每 一 列 必 须 在 GROUP 
BY 子 句 中 指定 ， 或 者 是 聚合 函数 的 结果 。 

HAVING 子 句 是 与 GROUP BY 联合 使 用 的 。 它 使 程序 员 可 以 指定 一 个 条 件 来 限制 哪些 组 
(在 GROUP BY 子 句 中 指定 ) 将 被 考虑 作为 最 后 的 查询 结果 。 在 应 用 聚合 之 前 ， 要 去 除 不 满足 
条 件 的 组 。 假 设 我 们 想 知道 每 个 系 教授 的 人 数 和 教授 的 平均 年 龄 ， 与 前 面 的 查询 相似 ， 但 是 
这 次 我 们 只 选取 教授 人 数 超过 10 人 的 系 。 这 可 以 利用 以 下 程序 完成 : 


SELECT P.DeptId, COUNT(P.Name) AS DeptSize, 
AVG( P.Age) AS AvgAge 

FROM PROFESSOR P 

GROUP BY P.DeptId 

HAVING COUNT(*) > 10 


HAVING fF (不 像 WHERE 条 件 ! ) 在 组 上 应 用 ， 而 不 是 在 单个 的 元 组 上 应 用 。 所 以 ， 
对 于 由 GROUP BY 子 句 产生 的 每 一 组 来 说 ，COUNT (+) 统计 元 组 的 数目 。 只 有 那些 统计 值 
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超过 10 的 组 才 会 做 进一步 处 理 。 最 后 ， 应 用 聚合 函数 到 每 一 组 以 便 为 每 一 组 产生 一 个 元 组 。 
注意 ， 上 面 的 查询 使 用 AS 来 给 由 聚合 函数 产生 的 列 命名 。 另 外 ，* 和 出 现在 HAVING 子 句 
中 的 COUNT 国 数 一 起 使 用 。* 和 聚合 函数 可 以 方便 地 结合 在 一 起 使 用 ， 它 可 以 在 SELECT 列表 
和 HAVING 子 句 中 使 用 。 然 而 ， 应 该 注意 的 是 ， 上 面 的 例子 还 有 另外 几 种 可 供 选择 的 方法 : 
我 们 可 以 使 用 PName， 甚 至 PDeptId 来 代替 * ， 因 为 不 显 式 要 求 (DISTINCT) 的 话 ，SQL 是 
` 会 消除 重复 的 。 
如 果 我 们 想 基于 1997 ~ 1998 学 年 的 成 绩 考 虑 系 主任 列表 的 候选 人 ， 那 么 可 以 使 用 下 列 
程序 : 


SELECT T.StudId, AVG(T.Grade) AS CrsAvg 
FROM TRANSCRIPT T 

WHERE T.Semester IN ('F1997','S1998') 
GROUP BY T.StudId 

HAVING AVG( T.Grade) > 3.5 


通常 ， 使 用 HAVING 子 句 只 是 语法 习惯 而 已 ， 借 助 于 FROM 子 句 中 的 伐 套 查询 也 可 以 产生 
同样 的 结果 。 


SELECT Stats.DeptId, Stats.DeptSize, Stats.AvgAge 
FROM (SELECT P.DeptId, 
COUNT(P.Name) AS DeptSize, AVG(P. Age) 
AS AvgAge , 
FROM PROFESSOR P 
GROUP BY P.DeptId) AS Stats 
WHERE Stats.ProfCount > 10 


然而 ， 应 该 避免 在 FROM 子 句 中 使 用 嵌 套 查询 。 

最 后 ， 通 常 不 必 指 定 查询 结果 中 行 的 顺序 。 如 果 和 希望 行 以 特定 的 顺序 排列 ， 就 可 以 使 用 
ORDER BY 子 句 。 例 如 ， 如 果 我 们 在 产生 系 主任 列表 的 SELECT 语句 中 包含 子 句 

ORDER BY CrsAvg 
查询 结果 的 行将 按 学 生平 均 成 绩 的 升序 排列 。 这 个 子 句 通常 以 查询 结果 的 列 名 列表 作为 参数 。 
根据 列表 中 指定 的 第 一 列 有 序 地 输出 行 。 如 果 多 个 行 在 那个 列 上 有 相同 的 值 ， 则 列表 中 指定 
的 第 二 列 就 用 来 决定 顺序 ， 依 此 类 推 。 例 如 ， 如 果 我 们 想 在 输出 系 主任 列表 的 候选 人 时 首先 
以 平均 成 绩 为 序 ， 然 后 再 以 学 号 为 序 ， 我 们 可 以 使 用 下 面 的 SELECT 语句: 

SELECT T.StudId, AVG(T.Grade) AS CrsAvg 

FROM TRANSCRIPT T 

WHERE T.Semester IN ('F1997','S1998') 

GROUP BY T.StudId 

HAVING AVG(T.Grade) > 3.5 

ORDER BY CrsAvg, StudId 

ORDER BY 子 句 中 指定 的 属性 必须 是 查询 结果 中 的 列 名 。 因 此 ， 我 们 在 这 个 例子 中 把 第 
二 个 元 素 称 为 StudId (而 不 是 T.StudId )， 因 为 默认 情况 下 ， 访 名称 就 是 查询 结果 中 的 列 名 。 
类 似 地 ， 不 在 SELECT 子 句 中 引入 列 的 别名 CrsAvg， 就 不 能 以 平均 成 绩 为 主 序 来 给 行 排序 ， 


因为 若 没 有 别名 这 一 列 就 没有 名 字 了 8 。 


O 结果 表 的 列 也 可 以 通过 它们 的 次 序 位 置 来 引用 ， 但 是 通常 不 鼓励 使 用 这 种 方式 。 
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默认 情况 下 使 用 升序 ， 但 是 也 可 以 指定 降序 。 如 果 在 上 面 的 例子 中 我 们 把 ORDER BY 子 
ERA 


ORDER BY DESC CrsAvg, ASC StudId 
则 查询 结果 的 行将 会 按照 平均 成 绩 的 降序 排列 。 对 于 平均 成 绩 相同 的 学 生 ， 则 按 学 号 的 升序 
排列 。 


6.2.5 简单 查询 计算 算法 
带 有 聚合 和 分 组 的 查询 计算 的 总 体 过 程 如 图 6-9 所 示 。 


ss SELECT  Attrs 
K E, WHERE Condition 





SELECT — Attrs => 
LL PRON — 







ez 一 GROUP BY Group Atir List ------- > 
HAVING Group Condition 
图 6-9 带 有 聚合 国 数 的 查询 计算 


第 一 步 ， 计 算 FROM 子 句 。 它 产生 一 个 表 ， 这 个 表 是 作为 参数 列 出 的 那些 表 的 笛 卡 儿 积 。 

第 二 步 ， 计 算 WHERE 子 句 。 它 对 第 一 步 中 产生 的 表 的 每 一 行进 行 单独 处 理 。 行 的 属性 值 
将 替换 条 件 中 的 属性 名 ， 然 后 计算 这 个 条 件 。 由 WHERE 子 句 产生 的 表 具 包含 那些 条 件 计算 为 
真 的 行 。 

第 三 步 ， 计 算 GROUP BY 子 句 。 它 把 第 二 步 中 产生 的 表 划 分 成 元 组 的 分 组 ;每 二 组 只 包 
含 在 组 属性 序列 表 的 所 有 属性 上 都 一 致 的 那些 元 组 。 

第 四 步 ， 计 算 HAVING 子 句 。 它 去 除 第 三 步 产生 的 组 中 没 能 满足 组 条 件 的 那些 组 。 

第 五 步 ， 计 算 SELECT 子 句 。 它 对 第 四 步 产生 的 每 一 组 计算 目标 序列 表 中 的 聚合 函数 ， 保 
留 作为 SEBEQT 子 句 参 数列 出 的 那些 列 ， 并 为 每 一 组 产生 一 行 。 

第 六 步 ， 计算 ORDER BY 子 句 。 它 利用 指定 的 列 的 列表 为 第 五 步 中 产生 的 行 排序 。 
SELECT 语句 输出 结果 表 。 
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对 GROUP BY 和 HAVING 的 限制 

分 组 要 遵守 一 些 规则 不 同 的 是 其 中 的 一 些 限制 实际 上 是 很 有 意义 的 ! 

考虑 带 有 聚合 的 SQL 查询 的 通用 形式 : 

SELECT attributeList, aggregates 

FROM relationList 

WHERE whereCondition (6.32) 

GROUP BY groupList 

HAVING groupCondition 

GROUP BY 子 句 的 目的 是 把 查询 结果 划分 成 组 ， 同 一 组 中 的 所 有 元 组 在 groupList 中 的 每 
个 属性 上 都 是 一 致 的 。 然 后 将 SELECT 子 句 中 的 聚合 函数 应 用 到 每 一 组 ， 以 产生 单个 的 元 组 。 
因为 对 SELECT 子 句 的 attributeList 中 的 每 个 属性 都 只 输出 单个 的 值 (那个 值 不 是 诊 合 值 )，、 所 
以 在 任意 一 组 中 的 所 有 元 组 必须 在 这 个 序列 中 的 每 个 属性 上 都 一 致 。 在 SQL 中 具有 这 个 性 质 
就 要 求 attributeList 是 groupList 的 一 个 子 集 ， 这 是 保证 每 一 组 产生 一 个 元 组 的 充分 条 件 。( 这 个 
条 件 并 不 是 必需 的 ， 但 是 对 于 大 多 数 的 用 途 来 说 是 很 普通 的 。) 

第 二 个 限制 是 有 关 HAVING 条 件 的 。 直 观 上 ， 我 们 需要 保证 groupCondition 对 GROUP BY 
指定 的 每 一 组 元 组 来 说 或 者 为 真 ， 或 者 为 假 。 通 常 ， 这 个 条 件 包含 了 许多 形 如 expr op expr 
的 原子 比较 ， 然 后 用 逻辑 连接 词 AND、OR 和 NOT 连 接 在 一 起 。 为 了 保证 expr op expr AEN, 
对 于 每 一 组 ， 都 必须 能 把 expri 和 exprz 计 算 为 单个 值 。 实 际 上 ， 这 就 意味 着 对 于 在 
groupCondition 中 提 到 的 每 一 列 ， 必 须 满 足下 面条 件 之 一 : 

1) 它 在 groupList 中 (因而 对 于 每 一 组 来 说 它 都 有 单个 的 值 )。 

2) 它 作为 聚合 函数 的 参数 出 现在 8rowpCordition 中 (因而 当 计算 聚合 的 时 候 ， 表 达 式 将 看 
到 单个 的 值 )。 

大 多 数 数据 库 管理 系统 增强 了 上 面 的 语法 限制 。 

我 们 也 应 该 注意 到 (6.32) 中 子 名 的 顺序 是 很 重要 的 。 例 如 HAVING 子 名 不 能 放 在 
GROUP BY 子 名 之前。 同样 ， 标 准 允 许 SQL 语 名 有 HAVING 子 句 ， 而 没有 GROUP BY 子 句 。 
在 这 种 情况 下 ， 查 询 的 SELECTFROM-WHERE 部 分 的 结果 被 视 为 一 个 组 ， 然 后 将 HAVING 中 
的 groupCondition 应 用 到 那 一 组 。 


6.2.6 再 论 SQL 中 的 视图 


到 目前 为 止 ， 我 们 所 讨论 的 关系 在 技术 上 通常 是 指 基本 关系 (base relation). Efe “E 
常 的 ”数据 库 关系 。 基 本 关系 的 内 容 物理 上 是 存储 在 磁盘 上 的 ， 独 立 于 数据 库 中 其 他 关系 的 
内 容 。 l 

在 第 4 章 我 们 已 经 讨论 过 , 视图 是 一 个 关系 ,但 是 它 的 内 容 通常 不 是 物理 存储 在 数据 库 中 ， 
而 是 定义 为 SELECT 语句 的 查询 结果 。 每 次 使 用 视图 的 时 候 ， 就 用 相关 的 查询 来 计算 其 内 容 。 
因此 ， 存 储 (在 系统 目录 中 ) 的 是 视图 的 定义 〈 即 决定 这 个 视图 内 容 的 查询 ) ， 而 不 是 视图 的 
内 容 。 

因为 每 个 视图 都 是 查询 执行 的 结果 ， 它 的 内 容 依赖 于 引用 视图 时 数据 库 中 基本 关系 的 
内 容 。 


查询 语言 中 视图 的 角色 类 似 于 传统 编程 语言 中 子 例 程 (subroutine). AE. FL 
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示 某 些 有 意义 的 查询 ， 它 用 于 其 他 一 些 经 常 提交 的 查询 ， 或 者 它 有 独立 的 作用 。 不 管 是 哪 种 
情况 ， 都 应 该 把 这 个 查询 抽象 出 来 ， 并 “假装 ”数据 库 中 包含 了 一 个 关系 ， 其 内 容 就 是 查询 
的 结果 。 - 

视图 机 制 的 另 一 个 重要 的 作用 就 是 控制 用 户 对 数据 的 访问 。 这 个 功能 在 4.1 节 和 4.3 节 中 简 
要 介绍 过 ， 我 们 将 在 本 节 的 后 面部 分 更 详细 地 讨论 它 。 

1. 在 查询 中 使 用 视图 

一 旦 定义 了 视图 ， 就 可 以 像 任 何其 他 表 一 样 在 SQL 查 询 中 使 用 它 了 。 当 查询 中 用 到 视图 
时 ， 它 的 定义 就 自动 替换 到 FROM 子 句 中 ， 如 图 6-10 所 示 。 

SELECT 用 到 视图 VIEw1 


FROM VIEW1 V 的 查询 
WHERE ... AND V.Attr = 'abc' AND ... 


SELECT 被 视图 定义 修改 
FROM (definition of VIEWI) V 的 查询 
WHERE ... AND V.Attr = 'abc' AND... 





图 6-10 使 用 视图 的 查询 修改 过 程 
假设 想 要 找 出 大 学 里 教授 的 平均 年 龄 最 低 的 系 ， 应 用 程序 设计 者 可 能 决定 除了 用 上 面 的 
查询 以 外 ， 还 可 以 用 许多 其 他 的 查询 来 计算 平均 年 龄 。 在 查询 处 理 中 ， 就 像 编 程 语言 那样 ， 
这 是 创建 计算 平均 年 龄 视图 的 很 好 的 理由 。 


CREATE VIEW AvGDEPTAGE (Dept ,AvgAge) AS 


SELECT P.DeptId, AVG(P.Age) 
FROM PROFESSOR P 
GROUP BY P.Dept 


这 个 视图 就 像 子 例 程 一 样 允许 我 们 单独 地 解决 一 个 较 大 问题 的 一 个 部 分 。 例 如 ， 我 们 现 
在 可 以 用 以 下 代码 找 出 教授 平均 年 龄 最 小 的 系 : 
SELECT A.Dept 

FROM AvGDEPTAGE A 


WHERE A. AvgAge = (SELECT MIN(A. AvgAge) 
FROM AvGDEPTAGE A ) 


(6.33) 


视图 可 以 使 复杂 的 SQL 查询 变 得 容易 理解 。( 并 被 调试 ! ) 考虑 查询 (6.24)， 它 要 找 出 选 
修 过 计算 机 科学 系 每 个 教授 所 讲授 过 的 课程 的 所 有 学 生 。 查 询 用 了 两 个 娩 套 子 查 询 ， 其 中 一 
个 子 查询 和 外 层 查 询 相关 。 因 为 嵌 套 问题 和 相关 问题 微妙 地 交织 在 一 起 ， 很 难 第 一 次 就 构造 
出 正确 的 查询 。 

我 们 借助 视图 就 可 以 简化 这 项 工作 。 视 图 


CREATE VIEW ALLCSproFIDs(ProfId) AS 
SELECT P.Id 
FROM PROFESSOR P 
WHERE P.Dept = 'CS' 


构造 了 所 有 计算 机 科学 系 教授 的 Id 的 集合 。 下 一 步 ， 我 们 定义 视图 来 表示 (6.24) 中 的 第 二 个 
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相关 子 查询 。 这 个 子 查询 的 目标 列表 只 有 一 个 属性 ProfId， 但 它 还 是 用 到 了 全 局 变量 S，S 是 
查询 返回 的 结果 集 的 参数 。 每 次 执行 查询 都 返回 教 过 某 个 学 生 的 所 有 教授 的 集合 。 因 为 SQL 
不 允许 创建 全 局 变量 作为 参数 的 视图 ， 我 们 临时 把 这 个 变量 的 属性 包括 在 目标 列表 中 。 更 精 
确 地 说 ,我 们 只 包括 在 子 查询 中 实际 用 到 的 全 局 变量 的 属性 。 在 我 们 的 例子 中 ,全 局 变量 是 5， 
额外 的 属性 是 StudId。 结 果 就 是 我 们 熟悉 的 (4.5) 中 定义 的 视图 PROFSTUD。 

但 是 ， 我 们 还 不 能 从 ALLCSPROFID 中 把 PROFSTUD 减 掉 ， 因 为 它们 不 是 并 相 容 的 。 另 外 ， 
SQL 只 允许 将 EXCEPT 运 算 符 应 用 到 子 查询 的 结果 上 ， 即 我 们 不 能 简单 地 从 一 个 表 中 减 去 另 一 
个 表 。 因 此 ， 我 们 仍然 必须 要 使 用 峰 套 子 查询 。 然 而 ， 现 在 的 子 查 询 比 (6.24) 中 的 子 查询 
更 易 管 理 ， 因 为 视图 使 我 们 能 把 一 个 复杂 的 问题 分 解 为 几 个 小 的 任务 。 

SELECT S.Id 

FROM STUDENT S 

WHERE 

NOT EXISTS ( 
(SELECT P.Id FROM ALLCSPROFIDs P) 
EXCEPT 


(SELECT P.Id FROM ProrStup P 
WHERE P.StudId = S.Id)) 


尽管 CREATE VIEW 语句 与 CREATE TABLE 语 句 在 用 于 基本 关系 的 时 候 不 大 相同 ， 但 是 
从 系统 目录 中 删除 视图 和 表 时 却 用 了 类 似 的 语句 : 对 于 视图 使 用 DROP VIEW， 对 于 基本 表 则 
使 用 DROP TABLE。 

如 果 我 们 想 删 除 一 个 视图 或 者 基本 表 ， 但 是 数据 库 中 有 (其 他 的 ) 视图 是 通过 这 个 视图 
或 这 张 表 定 义 的 ， 此 时 该 怎么 办 呢 ? 现在 的 问题 是 删除 这 样 的 视图 或 表意 味 着 所 有 通过 它们 
定义 的 视图 都 将 要 “被 遗弃 " ， 也 就 没有 办 法 再 使 用 它们 了 。 在 这 样 的 情况 下 ，SQL 把 决定 权 
留 给 了 DROP 语 名 的 设计 者 。 这 个 语句 的 一 般 形 式 为 

DROP {TABLE | VIEW } table or view {RESTRICT | CASCADE} 

如 果 使 用 RESTRICT 选 项 ， 那 么 若 有 某 个 视图 依赖 于 将 要 被 删除 的 表 或 视图 的 时 候 ， 删 除 
操作 将 会 失败 。 如 果 使 用 CASCADE 选 项 ， 所 有 依赖 视图 也 都 将 被 删除 。 

2. 物化 视图 . ' 

如 果 许 多 查询 都 用 到 一 个 视图 ， 那么 视图 的 内 容 就 可 以 存储 在 高 速 缓存 中 。 高 速 缓存 的 
视图 常常 称 为 物化 视图 (materialized view )。 视 图 缓存 能 够 在 很 大 程度 上 改善 根据 这 些 视 图 
定义 的 查询 的 响应 时 间 ， 但 是 更 新 事务 时 就 要 付出 代价 了 。 如 果 一 个 视图 依赖 于 一 张 基本 表 ， 
一 个 事务 更 新 这 张 基本 表 ， 那 么 视图 缓存 也 需要 更 新 。 

考虑 视图 (4.5), 假设 一 个 事务 向 TRANSCRIPT 中 增加 元 组 <023456789, CS315, S1997, B>. 
这 个 元 组 与 TEACHING 中 的 元 组 <101202303, CS315, S1997> 进 行 联结 以 产生 一 个 视图 元 组 
<101202303, 023456789>。 但 是 后 一 个 元 组 已 经 在 视图 ( 见 图 4-10) 中 了 ， 所 以 这 个 更 新 不 
会 改变 这 个 视图 。 如 果 我 们 向 TRANSCRIPT 中 增加 元 组 <023456789, MGT123, F1997, A>， 这 个 
视图 将 得 到 新 的 元 组 <783432188, 023456789> 和 <009406321, 023456789>。 

现在 考虑 若 从 定义 了 物化 视图 的 基本 关系 中 删除 元 组 时 会 发 生 什么 呢 ? 如 果 一 个 事务 从 
TRANSCRIPT 中 删除 了 元 组 <123454321, CS305, $1996, A> ， 有 人 可 能 会 认为 元 组 <101202303， 
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123454321> 也 应 该 从 视图 缓存 中 删除 。 但 实际 上 并 不 是 这 样 ， 因为 <101202303, 123454321> 
仍然 可 以 通过 联结 <123454321, CS315, $1997, A> 和 <101202303, CS315, S1997> 来 得 到 。 观 察 
图 4-10 指 出 元 组 <101202303, 123454321> 在 视图 中 的 两 个 理由 ， 删 除 <123454321, CS305, 
$1996, A> 只 去 除了 其 中 一 个 理由 ! 然而 ， 如 果 事 务 从 TRANSCRIPT 中 删除 <123454321， 
MAT123, S1996, C>， 则 应 该 从 视图 缓存 中 删除 元 组 <900120450, 123454321>。 

商用 数据 库 管理 系统 并 不 为 物化 视图 的 自动 维护 提供 直接 的 支持 ， 但 是 从 视图 缓存 中 自 
动 删除 元 组 或 往 视图 缓存 中 自动 插入 元 组 可 以 使 用 触发 器 来 实现 (参见 第 9 章 )。 即 使 这 样 ， 
触发 器 只 是 为 维护 视图 缓存 提供 了 基本 的 方法 。 就 像 我 们 刚刚 所 说 的 ， 维 护 视图 缓存 是 算法 
上 非 平 凡 的 任务 ， 特 别 是 在 对 效率 要 求 比较 高 的 时 候 。 我 们 在 本 书 中 不 再 深入 讨论 这 些 问题 。 
相关 文献 中 已 经 提出 过 许多 算法 ， 比 如 [Gupta et al. 1993, Mohania et al. 1997, Gupta et al. 
1995, Blakeley and Martin 1990, Chaudhuri et al. 1995, Staudt and Jarke 1996, Gupta and 
Mumick 1995]。 对 这 个 问题 ， 现 在 仍然 进行 着 较 多 的 研究 ， 因 为 物化 视图 对 于 数据 仓库 来 说 
显得 日 益 重要 。 

数据 仓库 (data warehouse) 是 ( 非 频 繁 更 新 的 ) 数据 库 ， 通 常 由 存储 在 单独 的 产品 数据 
库 中 的 数据 的 物化 视图 组 成 。 它 们 通常 用 于 在 线 分 析 处 理 (OLAP)，OLAP 在 第 1 章 简要 讨论 
过 并 将 在 第 19 章 中 详细 讨论 。 和 大 多 数 产 品 数据 库 相 比 ， 优 化 数据 仓库 是 为 了 查询 ， 而 不 是 
为 了 事务 处 理 ， 它 们 是 本 章 讨论 的 SQL 高 级 查询 功能 的 最 大 受益 者 。( 在 许多 事务 处 理 的 应 用 
程序 中 ， 快 速 响 应 时 间 和 高 吞吐 量 的 要 求 使 得 不 能 使 用 复杂 的 查询 。) 

3. 访问 控制 和 通过 视图 定制 

数据 库 视图 不 仅 可 以 用 作 一 种 子 例 程 机 制 ， 还 可 以 用 作 一 种 对 数据 访问 进行 控制 的 灵活 
工具 。 因 此 ， 我 们 可 以 允许 某 些 用 户 来 访问 一 个 视图 ， 而 不 是 定义 它 的 那些 表 。 例 如 ， 可 能 
不 允许 学 生 去 查询 PRoFESSOR 关 系 ， 因 为 该 表 存 储 着 和 SSN 有 关 的 信息 。 然 而 ， 可 以 让 学 生 访 
问 之 前 定义 的 AvGDEPTAGE 视 图 。 这 样 ， 尽 管 只 有 系统 管理 员 才 能 访问 PRoFESSOR ， 但 是 可 以 
人 允许 学 生 查询 视图 AvGDEPTAGE: 

GRANT SELECT ON AvGDEPTAGE TO ALL 

注意 通过 使 用 视图 ， 我 们 可 以 弥补 GRANT 语句 的 一 个 缺陷 。 在 授予 UPDATE (或 
INSERT) 权限 的 时 候 ， 人 允许 (可 选 的 ) 修改 指定 的 某 些 列 (或 者 可 以 插入 值 )， 但 是 在 授予 
SELECT 权限 的 时 候 ，SQL 不 能 指定 这 样 的 列 。 然 而 ， 我 们 可 以 通过 创建 可 访问 列 的 视图 并 授 
予 对 那个 视图 (而 不 是 基本 表 ) 的 访问 权限 来 达到 相同 的 效果 。 

视图 的 创建 者 (也 是 所 有 者 ) 不 一 定 也 是 定义 它 的 基本 表 的 所 有 者 。 所 必需 的 就 是 视图 
的 创建 者 在 定义 视图 所 需 的 所 有 关系 上 具有 SELECT 权 限 。 例 如 ， 如 果 PROFESSOR 关 系 为 
Administrator 所 有 ，Administrator 再 给 Personnel 授 予 对 PROFESSOR 的 SELECT 权 限 ， 则 
Personnel 就 可 以 创建 视图 AvGDEPTAGE， 而 后 提交 上 面 的 GRANT 语 句 。 

如 果 Administrator 决 定 从 Personnel 那 里 收回 SELECT 权 限 ， 那 将 会 怎么 样 呢 ? 注意 ， 如 果 
Administrator 收 回 了 这 个 权限 ， 则 视图 将 会 “被 丢弃 ”"， 没 有 人 可 以 再 查询 它 了 。 实 际 的 结果 
依赖 于 发 布 REVOKE 语 名 的 方式 。 如 果 系 统管 理 员 在 REVOKE 语 名 中 使 用 了 RESTRICT 选 项 ， 
收回 操作 将 会 失败 。 如 果 使 用 了 CASCADE 选 项 ， 就 可 以 进行 收回 并 且 将 会 从 系统 目录 中 删除 
视图 本 身 。 
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视图 的 另 一 个 用 途 是 进行 定制 ， 这 是 和 访问 控制 共同 作用 的 。 一 个 实际 的 产品 数据 库 可 
能 包含 几 百 个 关系 ， 每 个 关系 又 有 几 十 个 属性 。 然 而 ， 大 多 数 的 用 户 (包括 “初级 的 ”用 户 ， 
以 及 应 用 程序 开发 者 ) 只 需要 处 理 数据 库 模 式 的 一 小 部 分 ， 也 就 是 与 由 用 户 或 应 用 程序 执行 
的 特定 任务 相关 的 那 一 部 分 。 让 所 有 用 户 去 费劲 地 了 解 整个 数据 库 模 式 是 没有 好 处 的 。 更 好 
的 策略 是 创建 为 不 同 的 用 户 分 类 定制 的 视图 ， 所 以 AvGDEPTAGE 可 能 是 为 统计 员 定 制 的 视图 之 
一 。 这 种 方式 有 以 下 三 个 好 处 。 

1) 便于 使 用 和 学 习 。 这 可 以 加 快 应 用 程序 开发 ， 避 免 因为 误解 部 分 数据 库 模式 而 引起 的 
错误 。 

2) 安全 。 因 为 只 授予 各 种 用 户 和 应 用 程序 对 特定 视图 的 访问 权限 ， 因 此 减少 了 由 于 程序 
错误 、 人 为 错误 和 恶意 行为 所 带 来 的 可 能 的 损失 。 

3) 数据 逻辑 独立 性 (如 第 4 章 所 讨论 的 )。 如 果 以 后 需要 改变 数据 库 模式 ， 这 个 优点 将 会 
节省 大 量 的 维护 成 本 。 假 设 模式 的 重 构 不 会 导致 信息 的 损失 ， 针 对 视图 编写 的 应 用 程序 就 没 
必要 修改 了 一 一 唯一 需要 修改 的 是 视图 定义 。 


6.2.7 ZENER 


在 第 4 章 中 我 们 简要 讨论 了 空 值 (null value) 的 概念 。 例 如 ， 如 果 我 们 用 TRANSCRIPT 表 中 
的 元 组 来 代表 过 去 选修 过 的 课程 或 当前 学 期 正在 选修 的 课程 ， 一 些 元 组 可 能 在 Grade 属性 上 没 
有 有 效 的 值 。NULL 就 是 SQL 在 这 种 情况 下 用 到 的 占 位 符 。 

空 值 是 查询 处 理 中 令 人 头痛 (又 是 不 可 避免 的 ) 的 问题 。 如 果 条 件 T.Grade = 'A' 中 T 的 值 
是 在 Grade 属性 上 有 空 值 的 元 组 ， 那 么 该 条 件 的 真 值 是 什么 呢 ? 

考虑 到 这 个 现象 ，SQL 使 用 了 所 谓 的 三 值 远 辑 ， 这 里 真 值 有 true 、false 和 unknown， 当 
val 或 val: 中 至 少 有 一 个 值 是 NULL 时 ，val op val, (op 可 以 是 <、>、< >、= 等 ) 就 被 认为 是 
unknown, 

空 值 不 仅 影响 到 WHERE 子 句 和 CHECK 子 句 中 的 比较 ， 还 影响 到 算术 表达 式 和 聚合 函数 。 
当 算术 表达 式 遇 到 NULL 时 ， 它 自身 就 被 定 值 为 NULL。COUNT 把 NULL 当 作 正 常 值 (比如 ， 
语句 (6.28) 在 计算 管理 系 教授 人 数 的 时 候 把 NULL 和 正常 值 一 起 统计 )。 所 有 其 他 的 聚合 则 
把 空 值 丢掉 (比如 ,语句 (6.29) 在 计算 平均 值 的 时 候 忽略 了 Age 列 中 的 空 值 ) 。 然 而 还 是 要 
注意 ， 如 果 将 这 样 的 聚合 函数 应 用 到 只 有 NULL 的 列 上 ， 那 么 结果 还 是 空 值 。 

但 是 ， 还 有 其 他 令 人 混淆 的 情况 。 当 WHERE 子 名 或 CHECK 子 句 形 如 cond AND cond;、 
cond, OR cond: 或 NOT cond, 并 且 子 条 件 之 一 因为 有 NULL 隐 藏 在 其 中 而 计算 得 到 unknown 时 ， 
我 们 也 必须 找到 相应 的 解决 方法 。 这 个 问题 通过 图 6-11 所 示 的 真 值 表 得 以 解决 ， 它 给 出 了 依 
赖 于 子 条 件 值 的 各 种 布尔 函数 的 值 。 

这 些 表 应 该 很 清晰 了 。 其 基本 思想 是 很 简单 的 ， 假 设 我 们 需要 计算 true AND unknown 的 
fa. 因为 unknown 可 能 是 true， 或 者 是 false， 所 以 整个 表达 式 的 值 也 就 可 能 是 true ， 或 者 是 
false (也 就 是 unknown )。 另 一 方面 ， 不 管 unknown 是 true 还 是 false ， 计 算 表达 式 false AND 
unknown 和 true OR unknown 都 会 分 别 得 到 false 和 true。NOT 的 情况 也 可 以 做 类 似 的 处 理 。 

SQL 引入 了 另外 一 个 谓词 ITS NULL， 它 用 来 测试 某 个 值 是 否 为 NULL。 例 如 ， 当 赋予 的 
元 组 在 Grade 属性 上 有 空 值 的 时 候 ，T.Grade IS NULL 为 真 ， 否 则 为 假 。 有 趣 的 是 ， 这 是 SQL 
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中 唯一 真正 的 二 值 谓词 ! 














































cond, AND cond, | cond, OR cond NOT cond 
true true true true 
true false false true 
true unknown | unknown true 
false true false true 
false false false false 
false unknown | false unknown 
unknown | true unknown true 
unknown | false false unknown 
unknown | unknown | unknown unknown 





图 6-11 SQL 用 来 处 理 unknown 的 真 值 表 


那么 当 整 个 条 件 计算 得 到 unknown 时 ， 将 会 怎么 样 呢 ? 答案 要 取决 于 这 是 一 个 WHERE 子 
句 还 是 CHECK 子 句 。 如 果 WHERE 子 句 计算 得 到 unknown， 就 被 视 为 false， 相 应 的 元 组 也 不 
能 加 入 查询 结果 。 如 果 CHECK 子 句 计 算得 到 unknown， 就 要 考虑 遵守 完整 性 约束 了 (也 就 是 
结果 被 视 为 true )。 可 以 给 在 查询 和 约束 中 对 unknown 值 的 不 同 处 理 方法 一 个 合理 的 解释 。 确 
实 ， 我 们 假设 用 户 希望 查询 只 返回 确定 是 真实 的 答案 。 另 一 方面 ， 形 如 CHECK (condition) 
的 约 东 被 视 为 条 件 不 应 该 计算 得 到 false 的 语句 。 因 此 ，unknown 真 值 是 可 以 接受 的 。 

我 们 只 是 提出 了 SQL 中 空 值 的 大 体 框架 。 许 多 细节 还 设 有 涉及 ， 但 是 可 以 在 大 部 分 标准 
的 SQL 参考 书 中 找到 这 些 内 容 ， 像 [Date and Darwen 1997]。 例 如 ， 空 值 对 于 LIKE 条 件 、IN 条 
件 、 集 合 比较 (如 “> ALL”), EXISTS##tE. HREM (如 用 到 DISTINCT 的 查询 ) 等 等 会 
产生 怎样 的 影响 ? 考虑 在 这 些 情况 下 怎样 税 才 是 合理 的 ， 然 后 把 你 的 结论 和 [Date and Darwen 
1997] 中 的 结论 进行 比较 。 


6.3 在 SQL 中 修改 关系 实例 


到 目前 为 止 ， 我 们 已 经 讨论 了 查询 子 语言 一 一 SQL 中 最 难 的 一 部 分 。 然 而 ， 数 据 库 的 作 
用 不 仅 是 为 了 查询 ， 还 要 加 入 和 修改 适当 的 数据 。 本 节 主 要 讨论 用 于 数据 插入 、 删 除 和 修改 
的 那 部 分 SQL， 

1. 增加 数据 

INSERT 语 名 有 几 种 形式 ， 最 简单 的 一 种 就 是 程序 员 只 需 指定 要 插入 的 元 组 ， 这 个 语句 的 
第 二 个 版 本 可 以 插 人 多 个 元 组 ， 并 可 以 用 查询 来 指定 要 播 入 的 元 组 。 要 插 大 单个 元 组 ， 程 序 
员 只 要 编写 以 下 语句 : 


INSERT INTO PROFESSOR(DeptId,Id,Name) 
VALUES ('MATH','100100100', 'Bob Parker') 


INTO 子 句 中 的 属性 的 次 序 不 一 定 是 默认 的 次 序 ( 即 它们 在 CREATE TABLE 语 名 中 的 次 序 )。 
然而 ， 如 果 你 知道 默认 的 属性 次 序 ， 就 可 以 省 略 INTO 子 句 中 的 属性 列表 。 当 然 ， 此 时 VALUE 
子 句 中 项 的 次 序 必须 与 默认 的 属性 次 序 相对 应 。 尽 管 这 样 可 能 会 节省 一 些 时 间 ， 但 在 INTO 子 
句 中 省 上 略 属性 列表 是 容易 出 错 的 (比如 ， 考 虑 一 下 如 果 以 后 模式 发 生 改变 将 会 怎样 ),' 因 此 这 
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是 不 好 的 编程 风格 。 

INSERT 语 名 的 第 二 种 形式 可 以 将 大 量 的 元 组 插入 到 关系 中 。 将 要 插入 的 元 组 是 INSERT 
语句 中 查询 的 结果 。 注 意 ， 即 使 用 查询 来 定义 将 要 揪 入 到 关系 中 的 元 组 ， 这 种 机 制 也 从 根本 
上 不 同 于 通过 查询 来 定义 视图 ( 见 练习 6.18 )。 

举 个 例子 ， 我 们 将 一 些 元 组 插入 到 HARDCLAss 关 系 中 。 困 难 班级 是 指 有 10% 以 上 的 学 生 没 
有 通过 的 班级 。HARDCLASs 关 系 的 属性 是 课程 号 、 学 期 和 未 通过 率 。 

这 个 查询 实际 上 非常 复杂 (因为 在 SQL 中 表达 未 通过 率 需 要 多 思考 一 下 )， 所 以 我 们 一 步 
一 步 地 来 处 理 ， 首 先 定 义 两 个 视图 。 


--Number of failures per class 
CREATE VIEW CLassFaILuRES(CrsCode, Semester, Failed) AS 
SELECT T.CrsCode, T.Semester, COUNT(*) 
FROM TRANSCRIPT T 
WHERE T.Grade = 'F' 
GROUP BY T.CrsCode, T.Semester 


类 似 地 ， 我 们 可 以 定义 视图 CLAsSENROLLED， 它 统计 选修 每 门 课程 的 学 生 的 人 数 。 


~-Number of enrolled students per class 

CREATE VIEW CLASSENROLLED(CrsCode, Semester, Enrolled) AS 
SELECT T.CrsCode, T.Semester, COUNT(*) 
FROM TRANSCRIPT T | 
GROUP BY T.CrsCode, T.Semester 


现在 可 以 用 如 下 方法 向 HARDCLASs 中 添加 元 组 : 


INSERT INTO HARDCLASS (CrsCode, Semester, FailRate) 
SELECT F.CrsCode, F.Semester, F.Failed/E.Enrolled 
FROM CLASSFAILURES F, CLASSENROLLED E (6.34) 
WHERE F.CrsCode = E.CrsCode AND F.Semester = E.Semester 
AND (F.Failed/E.Enrolled) > 0.1 


最 后 一 个 查询 看 起 来 很 简单 ， 但 是 想象 一 下 如 果 没 有 视图 它 将 会 多 么 复杂 ! 

我 们 必须 还 要 提 到 一 些小 问题 。 第 一 ， 如 果 INSERT 语 名 插入 一 个 违反 某 个 完整 性 约束 的 
元 组 ， 那 么 整个 操作 将 会 异常 中 止 ， 并且 不 会 插入 元 组 (假设 设 有 对 约束 检查 执行 
DEFERRED 操 作 ， 这 将 在 10.3 节 中 描述 ) 。 : 

第 二 ， 有 可 能 在 VALUE 子 句 的 值 的 列表 中 省 略 了 一 个 值 (和 属性 列表 中 相应 的 属性 )， 并 
且 在 SELECT 子 句 中 省 略 了 一 个 属性 〈 如 果 CREATE TABLE 语 句 没 有 指定 NOT NULL )。 如 果 
CREATE TABLE 语 名 为 省 略 的 属性 指定 了 软 认 值 ， 那 么 就 用 默认 值 。 除 了 省 略 值 以 外 ， 更 好 
的 办 法 是 用 信息 性 更 强 的 关键 字 DEFAULT 或 NULL (任何 一 个 都 是 合适 的 )， 来 替代 省 略 的 值 
(4n (100100100, NULL, DEFAULT)). 

2. 删除 数据 

删除 元 组 类 似 于 INSERT 的 第 二 种 形式 ， 只 是 现在 要 用 DELETE 关 键 字 。 例 如 ， 删 除 在 
1991 年 秋季 和 春季 教授 过 的 困难 的 班级 ， 我 们 可 以 使 用 以 下 语句 : 


DELETE FROM HARDCLASS i 
WHERE Semester IN ('S1991','F1991') 


注意 ，DELETE 语 名 不 允许 在 FROM 子 句 中 使 用 元 组 变量 。 
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假设 为 了 改善 教学 水 平 ， 学 校 决定 解雇 某 门 课程 里 有 过 高 未 通过 率 的 所 有 教授 。 这 是 很 困 
难 的 (并 不 是 因为 有 终生 教授 的 原因 ! )。DELETE 语 句 的 FROM 子 句 确实 有 着 很 强 的 限制 形 
式 : 程序 员 只 可 以 指定 一 个 关系 ， 就 是 将 要 删除 其 元 组 的 那个 关系 。( 从 两 个 关系 的 笛 卡 儿 积 
中 删除 行 意味 着 什么 呢 ? ) 然而 ， 为 了 找 出 要 解雇 的 教授 ， 我 们 需要 看 一 下 关系 HARDCLASS， 
但 是 在 FROM 子 句 中 没有 这 个 关系 的 位 置 了 。 那 么 我 们 将 怎么 做 呢 ? ERRETEN! 


DELETE FROM PROFESSOR 


WHERE Id IN . 
(SELECT T.ProfId 
FROM ‘TEACHING T, HarpC ass H (6.35) 


WHERE T.CrsCode = H.CrsCode 
AND T.Semester = H.Semester 
AND H.FailRate > 0.5) 


3. 更 新 已 有 的 数据 

有 时 必须 改变 关系 中 已 有 元 组 的 某 些 属性 的 值 。 例 如 ， 下 面 的 语句 把 学 生 666666666 选 修 
的 课程 EE101 的 成 绩 由 B 改 为 A: 

UPDATE TRANSCRIPT 

SET Grade ='A' 

WHERE StudId ='666666666' AND CrsCode = 'EE101' 

注意 UPDAIE 语 句 和 DELETE 一 样 也 不 允许 使 用 元 组 变量 ， 它 的 FROM 子 句 形式 是 受 限制 
的 (更 准确 地 说 ，UPDATE 本 身 就 是 一 种 FROM 子 句 )。 结 果 ， 一 些 较 复杂 的 更 新 就 要 用 到 由 
套 查询 。 例 如 ， 如 果 我 们 决定 把 所 有 表现 欠 佳 的 教授 调任 到 行政 部 门 而 不 是 解雇 他 们 ， 我 们 
使 用 类 似 于 (6.35) 的 子 查询 。 


UPDATE PROFESSOR 
SET DeptId = 'Adm' 
WHERE Id IN 
(SELECT T.ProfId 
FROM TEACHING T，HARDCLASS H 
WHERE T.CrsCode = H.CrsCode 
AND T.Semester = H.Semester 
AND H.FailRate > 0.5) 


下 面 我 们 最 喜欢 做 的 事情 : 把 所 有 管理 员 的 工资 提高 10%: 


UPDATE EMPLOYEE 
SET Salary = Salary * 1.1° 
WHERE Department = 'Adm' 


(6.36) 


4. 视 图 的 更 新 

因为 视图 经 常用 作 定 制 工 具 ， 对 用 户 和 程序 员 隐 藏 了 概念 数据 库 模 式 的 复杂 性 ， 所 以 让 
程序 员 更 新 他 们 的 视图 是 很 自然 的 。 但 是 这 项 工作 说 起 来 容易 做 起 来 难 ， 因 为 存在 下 面 三 个 
问题 : 

1) 假设 我 们 在 TRANSCRIPT 上 有 一 个 简单 的 视图 一 一 在 属性 CrsCode、StudId 和 Semester 上 
的 投影 。 如 果 程 序 员 想 在 这 样 的 视图 中 插入 一 个 新 的 元 组 ， 则 Grade 属性 的 值 将 丢失 。 这 个 问 
题 并 不 严重 。 如 果 创 建 基本 关系 的 Create Table 语 名 允许 的 话 ， 我 们 可 以 用 空 值 填补 上 这 个 丢 
失 的 属性 ; 如 果 不 允 许 ， 插 人 命令 就 会 被 拒绝 。 
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2) 考虑 PROFESSOR 关 系 上 的 视图 CSPROF， 它 是 通过 在 Deptld = 'CS' 上 的 简单 选择 来 得 到 的 。 
假设 程序 员 要 插入 <121232343, 'Paul Schmidt', 'EE'>。 如 果 我 们 把 这 个 插入 传播 到 基本 关系 
( 即 PROFESSOR ) ， 我 们 可 以 观察 到 这 样 的 异常 : 在 插入 之 后 查询 这 个 视图 ， 却 没有 显示 刚刚 插 
入 的 元 组 的 任何 踪迹 。 实 际 上 ，Paul Schmidt 并 不 是 计算 机 科学 系 的 教授 ， 所 以 他 不 会 出 现在 
这 个 通过 选择 Deptd = 'CS' 来 定义 的 视图 中 。 

SQL 在 默认 情况 下 不 会 禁止 这 样 的 异常 ， 但 是 细心 的 数据 库 设计 者 可 能 会 加 上 子 句 WITH 
CHECK OPTION ， 来 保证 在 视图 中 新 插入 或 更 新 的 元 组 确实 满足 视图 的 定义 。 在 我 们 的 例子 
中 ， 我 们 可 以 编写 以 下 语句 : 

CREATE VIEW CSpror(Id,Name,DeptId) AS 

SELECT P.Id, P.Name, P.DeptId 
FROM PROFESSOR P 


WHERE  P.DeptId = 'CS' 
WITH CHECK OPTION 


3) 这 个 问题 更 加 复杂 了 。 某 些 视图 更 新 可 能 会 转换 为 多 个 对 定义 它 的 基本 关 杀 的 更 新 。 
这 是 一 个 潜在 的 非常 严重 的 问题 ， 因 为 由 单个 视图 更 新 而 产生 的 多 种 可 能 性 对 存储 的 数据 来 
说 可 能 产生 完全 不 同 的 结果 。 
为 了 说 明 第 三 个 问题 ， 考 虑 之 前 讨论 的 视图 PROFSTUD。 
CREATE VIEW ProrStup(ProfId,StudId) AS 
SELECT T.ProfId, R.StudId 
FROM TEACHING T, TRANSCRIPT R 


WHERE T.CrsCode = R.CrsCode 
AND T.Semester = R.Semester 


这 个 视图 的 内 容 在 图 4-10 中 加 以 描述 。 假 设 我 们 现在 决定 从 视图 中 删除 元 组 <101202303， 
123454321>。 这 个 更 新 应 该 如 何 传播 回 基本 关系 呢 ? 这 里 有 四 种 可 能 性 。 

1) 从 关系 TEACHING 中 删除 <101202303, CS315, S1997> 和 <101202303, CS305, S1996>, 

2) 从 关系 TRANSCRIPT 中 删除 <123454321, CS315, S1997, A> 和 <123454321, CS305, $1996, A>. 

3) 从 TEACHING 中 删除 <101202303, CS315, S1997> ， 并 从 关系 TRANSCRIPT 中 删除 
<123454321, CS305, $1996, A>. 

4) 从 TEACHING 中 删除 <101202303, CS305, S1996>， 并 从 关系 TRANSCRIPT 中 删除 
<123454321, CS315, $1997, A>. 

对 于 这 每 一 种 可 能 性 ， 由 视图 隐 含 的 联结 不 包含 元 组 <101202303, 123454321>, ME—AY 
问题 是 应 该 将 哪 一 种 可 能 性 应 用 到 视图 更 新 上 ? 

这 个 例子 说 明 ， 在 缺乏 额外 信息 的 情况 下 ， 有 时 不 能 把 视图 更 新 翻译 成 对 基本 关系 的 更 
新 。 在 为 了 消除 视图 更 新 的 战 义 而 定义 启发 式 方 法 方面 ， 已 经 做 了 大 量 的 工作 ,但 是 没有 一 
个 方法 能 够 成 为 可 接受 的 解决 方案 。SQL 采 用 了 最 简单 的 方法 ， 只 允许 更 新 一 类 有 极 强 限制 
的 视图 。 在 视图 定义 上 的 这 些 限制 的 实质 总 结 如 下 。 

1) 在 FROM 子 句 中 只 能 提 到 一 个 表 (并 且 只 能 提 到 一 次 )，FROM 子 句 不 能 有 修 套 子 查询 。 

2) 不 允许 有 聚合 、GROUP BY 子 句 、HAVING 子 句 或 集合 运算 。 

3) 视图 的 WHERE 子 句 中 的 风 套 子 查询 不 能 引用 视图 定义 的 FROM 子 句 中 用 到 的 表 。 由 套 
子 查询 既 不 能 显 式 地 在 FROM 子 句 中 引用 这 个 表 ， 也 不 能 隐 式 地 通过 定义 在 外 层 查询 中 的 变 





量 来 引用 这 个 表 。 

4) 不 允许 在 SELECT 子 句 中 有 表达 式 或 DISTINCT 关 键 字 。 

满足 这 些 条 件 (和 其 他 一 些 很 模糊 的 限制 ) 的 视图 称 为 可 更 新 的 (updatable) 视图 (在 
SQL 意义 上 )。 这 里 是 可 更 新 视图 的 例子 。 


CREATE VIEW CANTEACH(Professor, Course) 
SELECT T.ProfId, T.CrsCode 
FROM TEACHING T 


参考 图 4-5 的 数据 库 ， 假 设 我 们 从 视图 CANTEACH 中 删除 <09406321, MGT123>。 在 基本 关 
A (TEACHING) 中 有 两 个 元 组 会 引起 疑问 : <09406321, MGT123, F1994> 和 <09406321， 
MGT123, F1997>。 因 此 视图 更 新 到 TEAcHING 更 新 的 翻译 必须 要 删除 这 两 个 元 组 。 


6.4 参考 书目 


Codd 在 学 术 论 文 [Codd 1972, 1970] 中 引入 了 关系 代数 。SQL 是 由 IBM 的 System R 研 究 组 [Astrahan et 
al. 1981] 开 发 的 。[Melton and Simon 1992, Date and Darwen 1997] 是 SQL-92 的 参考 书 ，[Gulutzan and 
Pelzer 1999] 描述 了 SQL:1999 提 供 的 扩展 。 

过 去 ， 视 图 更 新 问题 引起 了 相当 大 的 关注 。 下 面 是 提出 各 种 解决 方案 的 部 分 著作 : [Bancihon and 
Spyratos 1981, Masunaga 1984, Cosmadakis and Papadimitriou 1983, Gottlob et al.1988, Keller 1985, 
Langerak 1990, Chen et al. 1995]。 物 化 视图 的 维护 问题 也 是 极 受 关注 的 研究 领域 [Gupta et al. 1993, 
Mohania et al.1997, Gupta et al. 1995, Blakeley and Martin 1990, Chaudhuri et al. 1995, Staudt and Jarke 
1996, Gupta and Mumick 1995]。 因 为 在 数据 仓库 中 物化 视图 很 重要 ， 因 而 进行 了 较 多 的 研究 。 


6.5 练习 


6.1 假设 R 和 S 是 关系 ， 分 别 包含 hg 和 ns 个 元 组 。 下 面 每 个 表达 式 的 结果 中 可 能 会 有 的 元 组 的 最 大 数目 和 

最 小 数目 是 多 少 〔 假 设 R 和 S 并 相 容 ): 

a.RUS 

b. RNS 

c.R-S 

d.R xS 

e. ROIS 

f. R/S 

B- Ose (R) x x, , (S) 
6.2 假设 R 和 S 是 表示 前 面 练习 中 关系 的 表 ， 设 计 返 回 上 面 练习 的 每 个 表达 式 的 结果 的 SQL 查询 。 
6.3 ”验证 笛 卡 儿 积 是 可 结合 的 操作 符 ， 即 l 

| rx(sxt)= (rxs)xt 

对 于 所 有 的 关系 r、s 和 t 都 成 立 。 

64 验证 选择 是 可 交换 的 ， 即 对 于 任何 关系 r 和 任何 一 对 选择 条 件 condi: 和 cond,， 有 
cond (Ocona(T)) = Ocona,( Ocond,(¥)) 

65 验证 对 于 任何 一 对 关系 r 和 s， 如 果 选 择 条 件 cond 只 涉及 到 在 关系 s 的 模式 中 提 到 的 属性 ， 那 么 


Ocond (r x s) =P X Ocond (s) 
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6.10 
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beet 


6.12 


6.13 


6.14 


证 明 : 如 果 r 和 s 是 并 相 容 的 ， 那 么 rns =Y es, 

用 除法 编写 一 个 关系 代数 表达 式 ， 它 产生 所 有 选修 了 每 个 学 期 开设 的 所 有 课程 的 学 生 (这 表明 他 们 
可 能 两 次 选修 了 同一 门 课程 )。 

用 除法 编写 一 个 关系 代数 表达 式 ， 它 产生 所 有 选修 了 开设 过 的 所 有 课程 的 学 生 。( 如 果 一 门 课程 开 
设 了 多 次 ， 那 么 他 们 必须 至 少 选修 一 次 。) 

两 个 关系 r 和 s 的 外 联结 (联结 条 件 为 cond) 表示 为 rq Mls, HELA. MRK, EAD 
ER (r 的 模式 ) FS (s 的 模式 ) 的 (可 能 进行 了 重 命名 ) 属性 的 并 的 模式 上 的 关系 。 然 而 ， 
rpa “2s 中 的 元 组 分 为 三 类 : (1) 在 r 和 s 正 常 联 结 中 出 现 的 元 组 。(2) r 的 不 与 s 中 任何 元 组 联结 的 
元 组 。 因 为 这 些 元 组 没有 值 对 应 于 来 自 S 的 属性 ， 所 以 它们 在 这 些 属 性 上 被 赋予 NULL。(3) s 的 不 
与 r 中 任何 元 组 联结 的 元 组 。 同 样 ， 这 些 元 组 在 R 的 属性 上 被 赋予 NULL 值 。 

构造 一 个 关系 代数 查询 ， 它 产生 和 rpza “xs 相同 的 结果 ， 要 求 只 使 用 并 、 差 、 第 卡 儿 积 、 普 通 的 联 
结 (不 是 外 联结 ) 这 些 操作 符 。 你 也 可 以 使 用 常数 关系 ， 即 不 依赖 于 数据 库 其 他 部 分 的 具有 固定 内 
容 的 关系 。 

使 用 图 4-4 的 学 生 注 册 系统 模式 ， 以 关系 代数 和 SQL 的 形式 来 表达 下 面 的 每 个 查询 。 

a. 列 出 由 属于 EE 或 者 MGT 系 的 教授 讲授 的 所 有 课程 。 

b. 列 出 所 有 在 1997 年 春季 和 1998 年 秋季 都 选修 过 课程 的 学 生 的 名 字 。 

c. 列 出 所 有 选修 过 至 少 两 门 来 自 不 同系 的 教授 讲授 的 课程 的 学 生 的 名 字 。 

d. 列 出 MGT 系 中 被 所 有 学 生 选 修 的 所 有 课程 。 

*e. 找 出 符合 下 列 要 求 的 系 : 有 一 位 教授 教 过 那个 系 开设 过 的 所 有 课程 。 

用 关系 代数 来 找 出 所 有 “可 能 ”的 班级 ， 其 不 通过 率 高 于 20%。 

因为 关系 代数 没有 聚合 操作 符 ， 所 以 我 们 必须 增加 这 样 的 操作 符 才能 解决 上 面 的 问题 。 你 应 该 使 
用 的 额外 操作 符 是 countws(r)。 

这 个 操作 符 的 含义 如 下 : A 和 8B 必须 是 r 中 属性 的 列表 。couniws(r) 的 模式 包含 B 的 所 有 属性 和 一 个 
额外 的 属性 (表示 计数 值 )。countwa(r) 的 内 容 定 义 如 下 : 对 于 每 个 元 组 ! E mle) (在 8B 上 的 投影 )， 
进行 Xa(0s-,(r)), .然后 对 结果 关系 中 的 元 组 的 数目 进行 计数 (os-,(r) 表 示 r 中 所 有 元 组 的 集合 ， 其 
在 8 的 属性 上 的 值 为 !)。 我 们 把 这 个 数目 表示 为 c(?)。 

关系 countws(T) 定 义 为 {<t, c(D)> | t E np(r)}。 

你 应 该 能 够 看 出 上 面 的 构造 就 是 SQL 中 的 GROUP BY 到 关系 代数 的 直接 转换 。 

阐述 下 面 代数 表达 式 的 含义 (其 中 一 些 查 询 可 能 在 大 学 中 产生 空 结果 ， 但 是 这 偏离 了 主题 ): 

A. NCrsCode, Semester (TRANSCRIPT) / Ncrscoge (TRANSCRIPT) 

D. Merscode, Semester (TRANSCRIPT) Í Tsemester (TRANSCRIPT) 

C. NcrsCode, Studia (TRANSCRIPT) / (ru (STUDENT))[StudId]} 

d. Ttcrscode Semester, Studia (TRANSCRIPT) / (md (STUDENT))[StudId] 

考虑 下 面 的 查询 


SELECT S.Name 
FROM STUDENT S, TRANSCRIPT T 
WHERE S.Id = T.StudId 
AND T.CrsCode IN ('CS305','CS315' ) 


这 个 查询 意味 着 什么 (用 一 个 简短 的 名 子 来 表达 其 含义 ) 2 写 出 一 个 等 价 的 SQL 查询 ， 不 要 使 用 
IN 操 作 符 和 集合 构造 。 
写 出 查询 (6.33)， 不 要 使 用 视图 。 
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用 SQL 来 表达 下 面 的 查询 。 假 设 给 STUpENT 表 增加 一 个 额外 的 属性 Age，PRoFEssoR 表 有 额外 的 属 

性 Age 和 Salary。 l 

a. 找 出 在 某 门 课程 中 得 过 A 的 学 生 的 平均 年 龄 。 

b. 找 出 每 门 课 程 的 成 绩 最 优秀 的 学 生 的 最 小 年 龄 。 

c. 找 出 每 门 课 程 的 成 绩 最 优秀 的 学 生 〈 并 且 他 还 选修 过 CS305 或 者 MAT123) 的 最 小 年 龄 。( 提示 : 
使 用 HAVING 子 名 会 有 帮助 。) 

d. 把 年 龄 低 于 40 并 且 在 1997 年 春季 或 者 1997 年 秋季 教 过 MAT123 的 每 个 教授 的 工资 提高 10%。( 提 
m: 试 着 在 UPPATE 语 句 的 WHERE 子 句 中 使 用 典 套 子 查询 。) 

e. 找 出 工资 比 所 有 教授 的 平均 工资 高 至 少 10% 的 教授 。( 提示 : 使 用 视图 ， 就 像 (6.34) 所 示 的 
HARDCLASS 例 子 那样 。) 

f. 找 出 工资 比 其 所 在 系 的 所 有 教授 的 平均 工资 高 至 少 10% 的 教授 。( 提示 :; 使 用 视图 ， 就 像 在 

(6.34) 中 那样 。) 

用 关系 代数 表达 下 面 的 查询 。 

a. (6.14) 

b. (6.18) 

c. (6.21) 

考虑 下 面 的 模式 : 

TRANSCRIPT (StudId, CrsCode, Semester, Grade) 

TEACHING (Profld, CrsCode, Semester) 

PROFESSOR (Id, ProfName, Dept) 

用 关系 代数 和 SQL 写 出 下 面 的 查询 : 找 出 所 有 选修 过 MUS 系 的 每 个 教授 教 的 一 门 课程 的 学 生 的 Id。 

把 上 面 的 查询 定义 为 SQL 视 图 ， 然 后 使 用 这 个 视图 来 回答 下 面 的 查询 : 对 于 选修 过 MUS 系 的 每 个 

教授 所 教 的 一 门 课 程 的 学 生 ， 如 果 他 选修 的 课程 的 数目 大 于 10， 那 么 显示 出 他 所 选修 的 课程 数目 。 

考虑 下 面 的 模式 : > 

BROKER (Id, Name) Account (Acct#, Brokerld, Gain) . 

用 关系 代数 和 SQL 写 出 下 面 的 查询 : 找 出 所 有 在 分 配给 他 们 的 账户 上 都 赚钱 的 经 纪 人 的 名 字 ( 即 

Gain>0 )。 

写 出 一 个 SQL 语句 〈 对 于 在 练习 6.19 中 给 出 的 数据 库 模式 ) 来 解雇 在 其 至 少 40% 的 账户 上 亏 钱 的 所 

有 经 纪 人 。 假 设 每 个 经 纪 人 至 少 有 一 个 账户 。( 提示 : 定义 中 间 视 图 来 方便 地 写 出 查询 。) 

解释 为 什么 视图 类 似 于 子 例 程 。 

考虑 下 面 的 模式 ， 它 表示 了 待 售 的 房屋 和 和 欲 购房 的 顾客 : 

CUSTOMER (Id, Name, Address) 

PREFERENCE (CustId, Feature) 

AGENT (Id, AgentName) 

House (Address, Ownerld, AgentId) 

AMENITY (Address, Feature) 

PREFERENCE 是 列 出 客户 所 要 求 的 所 有 特性 的 关系 (对 于 每 个 “顾客 /特性 ”有 一 个 元 组 ， 如 <123， 

'SBR'>, <123, '2BATH'>, <432，'pool> )，AMENITY 是 每 个 房屋 的 所 有 特性 的 关系 〈 对 于 每 个 

房屋 /特性 有 一 个 元 组 )。 

如 果 某 顾客 指定 的 所 有 特性 的 集合 是 某 房屋 所 有 特性 集合 的 子 集 ， 那 么 该 顾客 就 对 购买 该 房屋 感 
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6.23 


6.24 


6.25 


兴趣 。HousE 关 系 中 的 元 组 说 明了 谁 是 所 有 者 ， 谁 是 代理 该 房屋 的 房地产 代理 。 用 SQL 写 出 下 面 

的 查询 : 

a. 找 出 对 Id 为 007 的 代理 所 代理 的 每 一 所 房屋 都 感 兴趣 的 所 有 顾客 。 

b. 把 前 面 的 查询 当 作 视图 ， 检 索 形 如 <feature, number_of customers> 的 一 组 元 组 ， 结 果 中 的 每 个 

元 组 都 给 出 了 一 个 特性 和 要 求 这 一 特性 的 客户 的 数目 ， 并 且 : 

。 只 考虑 对 Id 为 007 所 代理 的 每 一 所 房屋 都 感 兴趣 的 顾客 。 

“对 feature 感 兴趣 的 顾客 的 数目 要 大 于 3。( 如 果 这 个 数目 不 大 于 3 ， 那 么 相应 的 元 组 <feature， 
number_of_ customers> 就 不 需要 加 到 结果 中 。) 


考虑 模式 PERSON (Id, Name, Age)。 写 出 一 个 SQL 查询 来 找 出 这 个 关系 中 按 年 龄 由 大 到 小 的 顺序 排 


在 第 100 位 的 人 ， 也 就 是 说 有 99 个 人 肯定 比 他 老 。( 可 能 会 有 多 个 这 样 的 人 ， 他 们 的 年 龄 相同 ， 也 
可 能 没有 这 样 的 人 。) 

本 章 的 最 后 一 节 给 出 了 SQL 中 可 更 新 视图 的 四 个 主要 的 规则 。 第 三 个 规则 说 明了 如 果 WHERE 子 名 
包含 了 娃 套 子 查询 ， 那 么 在 那个 子 查询 中 提 到 的 表 ( 显 式 或 隐 式 的 ) 不 能 是 用 在 视图 定义 的 
FROM 子 句 中 的 表 。 

构造 一 个 视图 ， 它 违反 可 更 新 性 条 件 3， 但 是 满足 条 件 1、2、4， 以 便 存 在 一 个 对 这 个 视图 的 更 新 ， 
它 涉 及 两 个 不 同 的 对 基本 关系 的 更 新 。 

举 一 个 查询 的 例子 ， 解 释 视图 和 用 INSERT 语 句 来 对 基本 关系 进行 大 量 元 组 插入 在 概念 上 的 区 别 。 





第 7 章 查询 语言 HI: 关系 演算 和 可 视 化 查询 语言 


在 第 6 章 ， 我 们 用 关系 代数 来 解释 了 SQL 查 询 是 如 何 计算 的 。 事 实 上 ， 数 据 库 管理 系统 经 
常用 关系 代数 作为 SQL 查 询 在 优化 前 被 翻译 成 的 高 级 中 间 代 码 。 然 而， 从 概念 上 和 语法 上 来 
说 ，SQL 基 于 一 种 完全 不 同 的 正式 查询 语言 ， 称 为 关系 演算 (relational calculus, “MR” Xt 
于 这 样 一 个 相对 简单 的 语言 来 说 可 能 令 人 党 得 很 复杂 )。 关系 演算 是 经 典 谓词 逻辑 的 一 个 子 集 ， 
谓词 逻辑 是 在 关系 模型 诞生 之 前 已 经 被 深入 研究 的 一 个 课题 。 EF.Codd 的 主要 贡献 之 一 是 他 
预见 到 这 个 工具 可 能 成 为 强大 的 数据 库 查询 语言 的 基础 。 

有 两 种 关系 演算 。 在 下 一 节 中 ， 我们 介绍 元 组 关系 演算 (Tuple Relational Calculus, TRC) 
的 基础 ， 它 最 早 是 在 [Codd 1972] 中 引入 的 。TRC 对 于 正确 理解 SQL 的 查询 子 语言 是 很 重要 的 。 
我 们 将 会 看 到 SQL 确实 可 以 视 为 用 英文 单词 替换 一 些 数学 符号 的 TRC。 例 如 ，[Date 1992] 给 
出 了 TRC 如 何 有 效 地 作为 构造 复杂 SQL 查询 的 中 间 语 言 。 

然后 我 们 介绍 域 关 系 演算 (Domain Relational Calculus，DRC)， 并 且 讨 论 基于 它 的 可 
视 化 查询 语言 。 如 果 你 具备 常见 谓词 逻辑 的 基础 知识 ， 那 么 DRC 看 起 来 就 很 熟悉 了 ， 因 为 它 
实质 上 是 那个 逻辑 的 一 个 子 集 。 它 是 在 [Lacroix and Pirotte 1977] 中 作为 数据 库 查询 语言 
出 的 。 


7.1 元 组 关系 演算 


TRC 中 的 查询 形式 如 下 
{T | Condition} 

T 左边 的 查询 部 分 称 为 查询 目标 (target); 右边 的 部 分 称 为 查询 条 件 (condition, 或 
查询 体 )。 

目标 包含 一 个 元 组 变量 (tuple variable) T7， 它 就 像 代数 中 常见 的 变量 一 样 ， 只 是 它 的 取 
值 范 围 是 值 的 元 组 (如 关系 元 组 )， 而 不 是 单个 的 值 ( 如 数值 和 字符 串 )。 

查询 条 件 必须 符合 下 面 的 条 件 : 

。 它 用 到 变量 7， 可 能 还 有 某 些 其 他 的 变量 。 

。 如 果 用 一 个 具体 的 值 的 元 组 替换 Conditrion 中 7 的 每 次 出 现 ， 则 条 件 计 算得 到 一 个 布尔 值 

true 或 false, 

这 里 有 一 个 简单 的 例子 : 找 出 1997 年 秋季 开设 的 课程 的 所 有 教学 记录 。 

{T | TEACHING(T) AND T.Semester = 'F1997'} 

项 TEACHING (T) 用 来 测试 元 组 T 是 否 属于 TEAcHING 的 关系 实例 。T.Semester = 'F1997' 是 另 
一 个 测试 ， 很 容易 看 出 这 个 TRC 查 询 与 下 面 的 SQL 查 询 相 对 应 。 


SELECT * 
FROM TEACHING T 
WHERE T.Semester = 'F1997' 
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现在 应 该 了 解 为 什么 我 们 之 前 说 SQL 实质 上 是 TRC 的 语法 变 体 。TRC 查 询 的 目标 与 SQL 查 
询 的 SELECT 列表 相对 应 。TRC 的 查询 条 件 在 SQL 中 被 拆 分 为 两 个 子 句 : FROM 子 句 (CAS 
Æ tnRelation (Variable) 的 条 件 ， 这 限制 了 特定 的 变量 的 取 值 范围 为 特定 关系 的 元 组 ) 和 
WHERE 子 句 〈 它 包含 所 有 其 他 的 条 件 )。 

理解 TRC 查 询 含 义 最 简单 的 方法 是 声明 性 地 考虑 它们 ， 不 要 考虑 特定 的 查询 计算 算法 。 
你 可 以 把 这 个 过 程 看 作 是 为 目标 元 组 变量 T 枚 举 所 有 可 能 的 选择 ， 然 后 检查 哪个 选择 在 给 定 的 
数据 库 实 例 的 情况 下 可 以 使 查询 条 件 为 真 。 这 个 解释 引出 了 下 面 的 定义 : 


给 定 一 个 数据 库 ，TRC 查 询 的 结果 是 能 使 查询 条 件 关于 此 数据 库 为 真 的 变量 TT 的 值 的 

所 有 选择 的 集合 。 

事实 上， 这 个 定义 也 是 思考 SQL 查询 的 正确 方法 (有 时 也 是 检验 SQL 查询 是 否 完成 程序 
员 想 要 做 的 事情 的 唯一 确定 的 方法 )。 

我 们 来 更 详细 地 看 一 看 这 个 定义 的 工作 原理 。 假 设 我 们 选择 <009406321, MGT123, 
F1980> 作 为 上 例 中 T 的 可 能 的 答案 。 用 它 替 换 T 产 生 

TEACHING (009406321, MGT123, F1980) AND 'F1980'= 'F1997' 

这 是 个 错误 的 猜测 。 这 个 元 组 不 属于 TEAcHING 的 关系 实例 (查看 图 4-5) ， 并 且 'F1980' = 
'F1997' 也 不 为 真 。 所 以 放弃 这 个 选择 。 

再 看 另 一 个 选择 : <009406321, MGT123, F1994>。 用 它 替换 T 产 生 

TEACHING (009406321, MGT123, F1994) AND 'F1994' = 'F1997' 


这 是 一 个 稍 好 的 选择 但 是 仍然 是 错误 的 猜测 。 尽 管 <009406321, MGT123, F1994> 属 于 关 
系 TEACHING 的 实例 (所 以 部 分 查询 条 件 为 真 )， 但 命题 F1994' = 'F1997' 仍 然 是 错误 的 。 

第 三 个 选择 <009406321, MGT123, F1997> 产 生 

TEACHING (009406321, MGT123, F1997) AND 'F1997' = 'F1i997' 

这 个 查询 在 数据 库 的 当前 状态 下 为 真 ， 所 以 最 后 一 个 元 组 属于 查询 结果 。 事 实 上 ， 只 有 
三 个 元 组 满足 这 个 查询 : <009406321, MGT123, F1997>、<783432188, MGT123, F1997> 和 
<900120450, MGT123, F1997>, 这 可 以 通过 对 所 有 域 中 所 有 可 能 的 元 类 进行 彻底 的 搜索 来 进 
行 验证 。 | 

当然 ， 数 据 库 管理 系统 并 不 需要 进行 彻底 的 搜索 。 事 实 上 ， 它 们 使 用 更 加 复杂 的 算法 
(对 于 不 同 的 数据 库 管 理 系 统 ， 这 些 算法 是 不 同 的 )。 然 而 ， 我 们 用 彻底 搜索 作为 教学 工具 给 
出 语言 的 语义 ， 是 因为 它 容易 理解 并 且 可 以 作为 衡量 较 复 杂 的 查询 计算 算法 的 标准 。 

另外 ， 彻 底 搜 索 的 语义 在 验证 一 个 SQL 查 询 的 特定 表达 是 否 完 成 了 我 们 希望 它 做 的 事情 
是 非常 有 用 的 。 因 为 当 编写 复杂 的 SQL 查询 的 时 候 ， 我 们 已 经 看 到 人 的 直觉 是 多 么 不 可 靠 。 

现在 我 们 可 以 来 学 习 TRC 的 细节 了 。 你 会 惊讶 地 发 现 我 们 已 经 给 出 了 大 多 数 基本 的 思想 。 
只 有 两 个 问题 还 需要 解释 一 下 : 

。 查 询 条 件 的 语法 。 

。 用 猜测 元 组 替换 查询 目标 中 的 元 组 变量 后 ， 条 件 为 真 的 含义 。 

1. 查询 条 件 的 语法 

在 查询 条 件 中 使 用 的 基本 构造 块 可 以 有 以 下 几 种 形式 : 
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。P(7)，P 是 关系 名 称 ，T 是 元 组 变量 。 从 直观 上 看 ，P(7) 用 来 测试 元 组 T 是 否 属于 P 的 关系 

实例 (当然 ， 只 有 在 给 7 选择 了 值 以 后 测试 才 是 有 意义 的 )。 例 如 : STUDENT(T)。 

。T.A oper S$.B，oper 是 比较 运算 符 (=. >. >. = 上 等 )，7 和 3 是 元 组 变量 ，4 和 8 是 属性 。 

项 7.4 表 示 7 中 与 属性 4 相对 应 的 分 量 。 这 里 的 含义 是 元 组 的 一 个 分 量 和 另 一 个 分 量 的 比 
较 。 例 如 : TStudId > S.Profld. 

“7.4 oper const。 这 和 前 面 的 形式 类 似 ， 只 是 它 是 和 常数 比较 ， 而 不 是 和 元 组 分 量 比较 。 

例如 : T.Semester = 'F1994', 

这 些 基 本 构造 块 称 为 原子 条 件 (atomic condition ) 。 较 复杂 的 查询 条 件 根 据 如 下 要 求 递归 
地 构造 : 

。 如 果 C 是 原子 条 件 ， 那 么 它 是 查询 条 件 。 

。 如 果 Cl 和 Cs 是 查询 条 件 ， 那 么 C1 AND C Ci OR CHANOT Cl 也 是 查询 条 件 。 

。 如 果 C 是 查询 条 件 ，R 是 关系 名 称 ，T 是 元 组 变量 ， 那 么 VT E R(C) 和 37 E R(C) 是 查询 条 

件 。 . 

符号 V 代 表 “ 任 取 ”， 符 号 3 代表 “存在 ”。 它 们 分 别称 为 全 称 量词 (universal quantifier) 
和 存在 量词 (existential quantifier). 

前 面 已 经 解释 了 原子 条 件 的 含义 ， 第 二 组 中 条 件 的 含义 应 该 是 很 明显 的 。 例 如 ， 当 且 仅 当 
Ci 和 Cs 都 判 | 定 为 真 时 ， Cı AND CFAR. 当 且 仅 当 C1 和 Cs 中 至 少 有 一 个 判定 为 真 ， Cı OR C, 
为 真 。 当 且 仅 当 C 为 假 时 ，NOT Ci 为 真 。 

量化 公式 的 含义 可 以 直接 从 公式 读 得 。 候 设 r 是 的 关系 实例 。 那么 VT E R(C) 表 示 : 对 
于 每 个 元 组 Er， 如 果 用 1 替换 变量 T， 那 么 C 将 为 真 。 类 似 地 ，37 E R(C) 表 示 : 存在 一 个 元 
grCr, AMIERTZE, CHAR. 

我 们 已 经 介绍 了 语法 ， 还 有 一 个 概念 。 在 公式 VT E R(C) 和 37 E R(C) 中 ， 变 量 T 称 为 被 量 
词 所 绑 定 (bound )。 任 何 设 有 以 这 种 方法 显 式 绑 定 的 变量 都 称 为 自由 (free) 变量 。 例 如 ， 在 
TName = S.Name 中 T 和 S 都 是 自由 变量 ， 但 是 在 VS E STUDENT (T.Name=S.Name) 中 ， 变 量 
S 是 绑 定 的 ，T 是 自由 的 。 

所 有 这 些 自由 变量 和 绑 定 变量 与 查询 的 语义 有 什么 关系 呢 ? 考虑 句子 在 X 天 下 十 了 。 这 里 
X 是 自由 变量 ， 因 此 如 果 我 们 不 把 X 有 具体 化 〈 也 就 是 特定 的 值 来 奉 换 它 )， 那 么 这 个 句子 就 没有 
真 值 。 为 了 比较 ， 考 虑 句子 对 于 所 有 日 子 X E 七 月 ， 在 X 这 一 天 下 十 了 。 句 子 的 表述 可 能 看 起 
来 有 点 别扭 ， 但 是 这 就 是 在 逻辑 中 叙述 它 的 方式 (这 样 可 以 消 除 可 能 的 混淆 )。 注 意 ， 第 二 
句子 中 仍然 有 一 个 变量 ， 但 是 现在 我 们 直观 上 能 感觉 到 这 个 句子 或 者 为 真 ， 或 者 为 假 (假设 
根据 上 下 文 可 以 弄 清楚 是 哪 年 七 月 以 及 所 说 的 是 哪个 地 方 )。 这 两 个 句子 之 间 主 要 的 区 别 是 X 
在 第 一 个 句子 中 是 自由 变量 ， 而 在 第 二 个 句子 中 是 绑 定 变 量 。 

这 个 讨论 指出 ， 绑 定 变 量 用 于 生成 关于 数据 库 中 元 组 的 断言 ， 而 自由 变量 用 于 指定 由 
”查询 返回 的 元 组 。 这 些 自由 变量 只 能 用 在 查询 目标 中 ， 因 为 查询 结果 是 由 为 目标 变量 替 
换 的 具体 值 决 定 的 。 在 替换 后 ， 查 询 条 件 就 不 应 该 再 有 任何 自由 变量 了 (否则 我 们 不 能 
辨别 为 目标 变量 选择 的 某 个 特定 值 是 否 让 查询 条 件 为 真 )。 因 此 ， 再 看 一 下 TRC 查 询 的 定 
义 {T1Condition}， 我 们 应 该 加 上 下 面 的 限制 : 

7 在 Condition 中 必须 是 唯一 的 自由 变量 。 
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2. 计算 查询 条 件 
那么 ， 我 们 如 何 来 决定 选择 的 元 组 是 否 满足 查询 条 件 呢 ? 让 我 们 来 看 一 个 具体 的 例子 。 


{ E | COoURSE(E) AND 
YS € STUDENT (ST € TRANSCRIPT( (7.1) 
T.StudId = S.Id AND T.CrsCode = E.CrsCode))} 


这 个 查询 返回 每 个 学 生 都 选修 了 的 所 有 课程 。 

让 我 们 来 看 一 看 E 的 某 个 选择 是 否 满足 查询 条 件 。 因 为 我 们 知道 ， 正 确 的 选择 必须 是 
CouRsE 中 的 元 组 ， 所 以 我 们 在 图 4-5 中 选择 属于 这 个 关系 的 一 个 具体 的 元 组 : <MGT123, 
MGT, Market, Analysis, Get rich quick>。 在 用 这 个 元 组 替换 了 E 之 后 ， 查 询 条 件 中 不 再 有 自由 
变量 ， 但 是 仍然 很 复杂 。 


COURSE(MGT123 ，MGT，Market Analysis, Get rich quick) AND 
YS € STUDENT (AT € TRANSCRIPT ( (7.2) 
T.StudId = S.Id AND T.CrsCode = 'MGT123')) 


为 了 确定 在 我 们 的 数据 库 中 这 个 条 件 是 否 为 真 ， 我 们 通过 逐步 地 切 下 语法 构成 的 片段 来 
递归 地 计算 它 ， 而 这 个 顺序 与 从 原子 条 件 来 构造 该 表达 式 的 顺序 相反 。 因 为 《7.2) 的 第 一 个 
分 量 在 我 们 的 数据 库 中 为 真 (元 组 <MGT123, MGT, Market, Analysis, Get rich quick> 描 述 了 一 
个 已 存在 的 课程 ) ， 我 们 只 需要 检查 第 二 个 分 量 是 否 为 真 。 

第 二 个 分 量 中 最 外 层 的 片断 是 VS E STUDENT。 这 个 量词 的 作用 是 说 明 ， 对 于 每 一 个 具体 
的 元 组 s E STUDENT， 如 果 我 们 用 元 组 替换 变量 9， 子 条 件 

JT € TRANSCRIPT (T.StudId = s.Id AND T.CrsCode = 'MGT123') (7.3) 
必须 为 真 。 如 果 是 这 样 的 话 ， 表 达 式 (7.2) 计算 得 到 真 。 子 条 件 (7.3) 即使 只 对 STUDENT 中 
的 一 个 元 组 为 假 ， 那 么 整个 条 件 (7.2) 也 计算 得 到 假 。 

因为 我 们 需要 对 所 有 学 生 测 试 (7.3)， 让 我 们 从 描述 John Doe 的 图 4-2 来 试 试 这 个 元 组 。 
因为 它 的 Id 分 量 是 111111111， 所 以 我 们 就 要 用 111111111 替 换 s.Id 来 计算 (7.3)。(7.3) 中 最 外 
层 的 结构 是 3T E TRANSCRIPT， 所 以 如 果 我 们 能 找到 一 个 元 组 ! E TRANSCRIPr， 并 且 在 用 1 替换 T 
之 后 条 件 

t.StudId = 111111111 AND ¢.CrsCode = 'MGT123' 

AR, BA (7.3) 的 结果 为 真 。 顺 便 提 一 下 ， 通 过 TRANSCRIPT 中 的 一 个 元 组 可 以 看 出 John 

Doe 在 1997 年 秋季 选修 了 MGT123， 并 成 绩 为 B。 所 以 ， 用 这 个 元 组 替换 T， 我 们 得 到 
111111111 = 111111111 AND 'MGT123' = 'MGT123' 

这 在 我 们 的 数据 库 中 为 真 ， 因 为 每 个 子 条 件 都 为 真 。 

假设 我 们 最 初 的 选择 <MGT123, MGT, Market Analysis, Get rich quick> 是 查询 的 一 个 答 
案 ， 我 们 的 工作 是 不 是 完成 了 呢 ? 不 ! 我 们 还 要 检验 对 于 每 个 元 组 * E STUDENT, (7.3) 都 为 
真 。 到 目前 为 止 ， 我们 只 是 确定 了 当 s 是 描述 John Doe 的 元 组 时 ， 这 个 条 件 才 为 真 。 

现在 假设 * 是 描述 Homer Simpson 的 元 组 ， 其 Id 为 023456789， 为 了 使 s 满 足 (7.3)， 我 们 需 
要 验证 ， 在 TRANSCRIPT 中 存在 一 个 元 组 ， 如 果 我 们 用 它 来 替换 T， 那 么 在 数据 库 中 ， 焉 面 的 语 
句 将 为 真 : 


T.StudId = 023456789 AND T.CrsCode = 'MGT123' 
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我 们 可 以 依次 试 试 TRANSCRIPT 中 的 每 一 个 元 组 ， 但 是 我 们 通过 验证 这 个 关系 没有 元 组 的 
StudId 属 性 是 023456789 且 CrsCode 属 性 是 MGT123， 从 而 节省 一 些 时 间 。 因 此 ，(7.3) 中 
Homer Simpson 元 组 的 替换 产生 了 一 个 在 我 们 数据 库 中 为 假 的 条 件 ， 因 而 (7.3) 对 于 我 们 数 
据 库 中 的 每 一 个 学 生 并 不 是 都 为 真 。 这 意味 着 (7.2) 为 假 ， 所 以 我 们 最 初 的 《对 CouRsE 中 某 
元 组 的 ) 假想 不 是 查询 (7.1) 答案 。 

如 果 你 有 时 间 ， 你 可 以 检查 一 下 没有 选择 满足 (7.1) 中 的 查询 条 件 ， 所 以 结果 为 空 。 但 
并 不 是 一 定 会 这 样 。 如 果 我 们 为 MGT123 增 加 适当 的 成 绩 记 录 ， 使 我 们 的 数据 库 中 所 有 学 生 
都 选修 了 这 门 课 程 ， 那 么 描述 MGT123 的 CouRsE 元 组 将 会 属于 查询 结果 。 l 

上 面 的 过 程 尽管 很 乏味 ， 但 是 实质 上 是 专家 用 来 检验 一 个 选择 是 否 属于 查询 结果 的 方法 。 
有 了 一 些 经 验 之 后 ， 你 可 以 开发 各 种 便捷 方法 和 省 时 的 工具 (“ 优 化" )， 但 是 上 面 的 过 程 仍然 
将 作为 “正确 性 准则 ”。 查 询 设 计 者 可 以 用 某 个 类 似 的 过 程 来 验证 一 个 特定 的 查询 设计 是 否 满 
足 相 应 的 要 求 。 

3. 例子 

上 面 检验 TRC 查 询 的 过 程 无 疑 是 乏味 的 ， 但 是 你 不 必 在 每 次 设计 一 个 查询 的 时 候 都 执行 
它 (就 好 像 你 不 用 为 文件 中 的 每 条 记录 都 手工 执行 Java 程 序 来 确保 这 个 程序 是 正确 的 )。 在 大 
多 数 的 情况 下 ， 如 果 你 严格 地 把 TRC 翻 译 成 自然 语言 ， 那 么 可 以 通过 阅读 这 些 文字 来 验证 查 
询 。 这 个 方法 在 许多 情况 下 是 很 有 效 的 ， 因 为 人 对 于 逻辑 正确 性 有 着 天 生 的 敏感 。 然 而 ， 有 
时 复杂 的 查询 翻译 可 能 也 会 非常 复杂 ，、 这 时 上 面 的 验证 过 程 就 起 作用 了 9 。 

为 了 更 好 的 感受 一 下 TRC， 我 们 考虑 一 些 通常 在 关系 代数 中 需要 联结 、 投 影 和 选择 的 查 
询 。 在 TRC 中 ， 这 样 的 查询 需要 3 和 AND。 为 了 简化 我 们 的 查询 ， 我 们 稍微 扩展 一 下 语法 ， 
允许 在 目标 中 出 现 多 个 元 组 变量 ， 对 于 不 同 的 元 组 变量 允许 混合 使 用 形 如 T.attribute 的 项 。 
比如 ， 

{S.Name, T.CrsCode | STUDENT(S) AND TRANSCRIPT(T) AND...} 

这 个 扩展 只 是 为 了 符号 上 的 方便 ， 因 为 我 们 能 够 用 先前 较 严 格 的 语法 来 编写 同样 的 查询 ， 
这 就 要 引入 新 的 具有 属性 Name 和 CrsCode 的 元 组 变量 R。 


{R [3S e STUDENT (AT € TRANSCRIPT ( 
R.Name = S.Name AND R.CrsCode = T.CrsCode AND...))} 


BE ify Fi) k et MGT 123 6 HA MARL FAREA: 
{P.Name | PROFESSOR(P) AND 
3T € TEACHING (P.Id = T.ProfId AND T.CRSCODE = 'MGT123')} 
注意 ， 如 果 我 们 要 把 这 个 查询 表达 成 关系 代数 形式 的 话 ， 它 将 涉及 到 选择 、 投 影 和 联结 
运算 符 。 相 应 的 SQL 查询 也 只 是 语法 的 变 体 。 
SELECT P.Name 


FROM PROFESSOR P, TEACHING T 
WHERE P.Id = T.ProfId AND T.CrsCode = 'MGT123' 


© 比较 一 下 验证 TRC (或 5QL) 查询 和 验证 Java 程 序 是 很 有 趣 的 。 在 TRC 中 ， 程 序 短小 但 是 单个 语句 的 功能 
却 非常 强大 。 因 而 ， 困 难 就 在 于 验证 少量 功能 强大 的 语句 的 组 合 含义 。 相 比 之 下 ， 在 Java 中 ， 每 个 命令 都 . 
很 容易 检查 ， 但 是 程序 却 很 长 。 因 而 ， 午 懂 大 量 简单 语句 的 执行 结果 是 很 困难 的 。 
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如 果 我 们 想 得 出 教 过 Homer Simpson 的 教授 的 名 字 ， 我 们 可 以 编写 以 下 语句 : 


{P.Name | PROFESSOR(P) AND 
JT € TRANSCRIPT (4S € STUDENT (JE € TEACHING( 
P.Id = E.ProfId AND T.StudId = S.Id AND 
E.CrsCode = T.CrsCode AND E.Semester = T.Semester 
AND S.Name = 'Homer Simpson'))} 


下 面 的 查询 找 出 选修 过 两 次 〈 但 是 在 不 同学 期 ) 同一 门 课程 的 所 有 学 生 的 Id: 


{T.StudId | TRANSCRIPT(T) AND 
JT1 € TRANSCRIPT( 
T.StudId = Ti.StudId AND T.CrsCode = T1.CrsCode 
AND T.Semester # T1.Semester)} 


注意 ， 在 这 个 查询 中 我 们 用 到 了 两 个 元 组 变量 ， 一 个 是 自由 变量 ， 一 个 是 绑 定 变量 ， 两 
个 都 在 TRANscRIPT 上 变化 。 在 关系 代数 中 ， 我 们 可 能 就 要 将 TRANSCRIPT 与 自身 做 联结 了 (不 使 
用 等 值 联结 ) 。 

让 我 们 再 来 看 一 看 在 关系 代数 中 需要 用 到 除法 运算 符 的 查询 。 我 们 已 经 详细 讨论 了 查询 
(7.1)， 它 产生 每 个 学 生 都 选修 过 的 所 有 课程 的 列表 。 在 讨论 除法 运算 符 时 ， 我 们 构造 查询 
(6.1)， 它 产生 选修 过 教 过 课 的 每 个 教授 的 课 的 所 有 学 生 的 列表 。 在 TRC 中 ， 这 个 查询 表达 为 


{R.StudId |YT € TEACHING (3T1 € TEACHING (TRANSCRIPT(R) 
AND T.ProfId = Ti.ProfId AND T1.CrsCode = R.CrsCode (7.4) 
AND Ti.Semester = R.Semester))} 


下 面 将 解释 这 个 查询 。T.ProfId 的 一 个 特定 值 确定 了 教 过 课 的 一 个 教授 。 如 果 TEACHING 中 
存在 一 个 元 组 T1， 指 出 了 这 个 教授 教 了 一 门 课 .( 即 T.ProfId = T1.ProfId)， 并 且 这 个 学 生 选 修 
过 这 门 课 ( 即 T1.CrsCode = R.CrsCode AND T1.Semester = R.Semester)， 那 么 Id 为 R.StudId 的 
学 生 就 选修 过 这 个 教授 的 这 门 课 。 如 果 这 个 学 生 选 修 过 所 有 这 样 教授 (WT € TEAcHING) 的 一 
门 课 的 话 ， 那 么 该 学 生 就 应 该 在 查询 结果 中 。 

这 个 查询 比 等 价 的 代数 查询 (6.1) 看 起 来 要 稍微 复杂 一 些 。 然 而 ， 我 们 在 TRC 中 不 需要 
引入 特别 的 运算 符 来 处 理 这 样 的 查询 ( 试 试 不 用 除法 运算 符 来 编写 查询 (6.1) !)， 并 且 TRC 
查询 也 更 加 灵活 。 例 如 ， 如 果 我 们 想 列 出 的 是 学 生 的 姓名 而 不 是 1d， 那 么 我 们 所 要 做 的 就 是 
把 S.Id 替 换 成 SName。 相 比 之 下 ， 在 代数 中 这 需要 与 CouRsB 关 系 再 做 一 次 联结 。 

注意 ， 如 果 我 们 省 略 存在 量化 的 变量 T1 ， 而 在 查询 的 其 余部 分 用 T 来 替换 它 ， 我 们 将 得 到 
选修 过 学 校 所 有 课程 的 所 有 学 生 (与 在 每 个 教授 那里 选修 过 一 门 课 相 反 )。 研 究 一 下 这 个 查询 
并 理解 它 与 查询 (7.4) 之 间 的 区 别 是 一 个 很 有 用 的 练习 。 

45 (74) 相应 的 SQL 查 询 就 更 难 编写 了 ， 因 为 SQL 设 计 者 考虑 到 全 称 量词 难以 正确 使 用 ， 
所 以 就 从 该 语言 中 去 掉 了 这 些 量词 。( 但 是 我 们 应 该 注意 到 SQL:1999 已 经 引入 了 全 称 量 词 和 
存在 量词 的 受 限 形 式 ， 即 FOR ALL 和 FOR SOME 运 算 符 。 ) 为 了 弥补 这 一 点 ，SQL 具 有 许多 像 
嵌 套 子 查询 和 EXISTS 运 算 符 这 样 的 特性 ， 但 是 这 些 特性 更 难 使 用 。 因 而 ， 用 TRC 和 用 SQL 表 
达 上 面 查询 的 主要 的 语法 差异 就 在 于 需要 把 全 称 量词 翻 译 成 等 价 的 使 用 账 套子 查询 的 语句 。 
和 SQL 不 同 ，TRC 设 有 支持 嵌 套 子 查询 的 语法 。 然 而 ， 这 样 的 子 查询 可 以 用 本 节 后 面 讨论 的 
视图 来 表达 。 . 

TRC 查 询 有 一 些 重 要 的 特性 值得 注意 。 首 先 ， 相 邻 的 存在 量词 可 以 互 换 位 置 。 事 实 上 ， 
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我 们 既 可 以 写成 
JIR € TRANSCRIPT (3T] € TEACHING (...)) 
也 可 以 写成 

JT1 € TRANSCRIPT (SR € TEACHING (.. .)) 

这 可 以 用 之 前 给 出 的 计算 查询 条 件 的 方法 来 加 以 验证 。 

第 二 ， 全 称 量词 和 存在 量词 不 可 以 互 换 位 置 。 好 好 想 一 想 就 知道 “对 于 每 个 TEACHING 元 
组 ， 存 在 一 个 TRANSCRIPT 元 组 使 得 命题 St 为 真 ” 和 “存在 一 个 TRANSCRIPT 元 组 ， 对 于 所 有 的 
TEACHING 元 组 ， 命 题 St 为 真 ”是 不 一 样 的 。 

第 三 ， 在 关系 演算 中 ， 量 词类 似 于 begin/end 块 ， 因 为 它们 定义 了 变量 的 作用 域 。 例 如 ， 

VT € Ri (U(T) AND AT € R; (V(T))) 
BEN. RETH ARREST ARAN. Ak, RRA ERR ERE 
的 begin/end 块 中 那样 ， 这 两 次 出 现 是 完全 独立 的 ， 上 面 的 表达 式 等 价 于 

vTeRi(U(T) AND 3S€R,(V(S))) 
这 里 5 是 某 个 其 他 的 新 变量 。 

4. TRC 中 的 视图 

现在 ， 假 设 我 们 想 稍微 修改 一 下 查询 (7.4)。 这 次 不 是 列 出 选修 过 每 个 教授 的 一 门 课程 的 
学 生 ， 而 是 想 看 看 选修 过 每 个 计算 机 科学 系 教授 的 一 门 课程 的 学 生 。 这 看 起 来 好 像 只 是 很 小 
的 变化 ， 但 是 可 能 会 给 TRC 带 来 极 大 的 困难 〈 而 利用 代数 却 不 会 ! )。 这 个 查询 的 SQL 公式 在 
查询 (6.24) 中 给 出 。 

直观 地 ， 人 和 修改 (7.4) 来 处 理 这 个 查询 的 最 简单 的 方法 是 用 VT © CSTEACHING 来 替换 YT € 
TEACHING， 这 里 CSTEACHING 是 TEACHING 的 一 个 子 集 ， 它 与 由 计算 机 科学 系 教授 教 的 课程 相对 
应 。 如 果 我 们 有 这 样 的 一 个 关系 ， 那 么 这 个 改变 确实 是 正确 的 。 然 而， 这 个 关系 在 我 们 的 数 
据 库 中 是 不 存在 的 ， 所 以 我 们 需要 找到 绕 过 这 个 问题 的 一 个 途径 。 

我 们 可 能 想 通 过 向 查询 条 件 ( 在 最 内 层 的 括 弧 中 ) 增加 


AND FP € PROFESSOR (P.DeptId = 'CS' AND P.Id = T.Prof Id) (7.5) 


来 改变 〈7.4)， 但 这 是 错误 的 。 因 为 T 是 在 整个 TEACHING 关 系 上 变化 ， 上 面 对 (7.4) 的 增加 
必须 对 TEACHING 中 T.Profld 的 所 有 值 都 为 真 ， 这 只 有 在 数据 库 中 每 个 任课 教授 都 在 计算 机 系 工 
作 的 情况 下 才 有 可 能 (而 这 并 不 是 实际 情况 )。 正 确 的 查询 比较 复杂 ， 这 需要 一 些 耐 心 来 理解 

这 样 编写 的 原理 。 
{R.StudId | VT e TEACHING (3T1 € TEACHING (TRANSCRIPT(R) AND 
NOT (3P € PROFESSOR (P.DeptId = 'CS' AND P.Id = T.ProfId)) 


OR (T.ProfId = Ti.ProfId AND T1i.CrsCode = R.CrsCode 
AND T1.Semester = R.Semester)))} 


这 个 条 件 指 出 ，R 的 值 必 须 是 TRANSCRIPT 的 元 素 ，T.ProfId 可 能 不 是 计算 机 系 的 教授 ， 或 
者 R.StudId 选 修 过 一 门 T.ProfId 教 的 课 。 

幸运 的 是 ， 有 一 种 获得 相同 结果 的 更 为 简单 的 方法 。 让 我 们 回 到 我 们 第 一 次 的 尝试 中 去 : 
试 着 用 VT © CSTEACHING。 这 里 的 问题 是 关系 CSTEACHING 并 不 在 我 们 最 初 的 数据 库 中 。 然 而 ， 


(7.6) 
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我 们 可 以 用 查询 来 定义 它 。 事 实 上 我 们 定义 了 更 简单 的 关系 。 
CSPROF = {P.ProfId | PROFESSOR(P) AND P.DeptId = 'CS'} 
我 们 可 以 在 较 大 的 查询 中 把 它 用 作 数 据 库 视图 (或 作为 “ 子 例 程 ”)。 


{R.StudId | VP € CSproF (4Ti € TEACHING (TRANSCRIPT(R) 
AND P.ProfId = T1.ProfId AND T1.CrsCode = R.CrsCode (7.7) 
AND T1.Semester = R.Semester))} 


实际 上 ， 复 杂 查 询 〈7.6) 是 类 似 于 采用 查询 (7.7) 并 在 视图 CSPROF 的 定义 中 做 了 替换 了 
的 TRC。 这 样 替换 复杂 的 结果 并 不 令 人 觉得 奇怪 ， 想 一 想 如 果 Java 程 序 中 所 有 子 例 程 都 被 替 
换 了 将 会 怎样 ! 浏览 一 下 代数 查询 的 例子 ， 它 揭示 了 这 种 子 例 程 的 广泛 使 用 ， 这 就 是 为 什么 
一 些 查 询 看 起 来 比 它们 对 应 的 TRC 查 询 更 简单 的 原因 。 


7.2 通过 元 组 关系 演算 理解 SQL 


我 们 已 经 看 到 ，SQL 实 质 上 就 是 元 组 关系 演算 的 语言 ， 其 间 点 缀 着 别 的 语言 ， 目 的 是 隐 
藏 与 谓词 逻辑 的 关系 。 

除了 来 源 上 的 关系 外 ，TRC 对 于 SQL 来 说 是 极为 重要 的 ， 因 为 理解 TRC 有 助 于 编写 复杂 
的 SQL 查询 。 一些 SQL 书籍 依靠 关系 代数 来 解释 通常 的 SQL 查询 的 意义 (就 像 第 6 章 那样 ) 。 
但 是 ， 代 数 表达 式 并 不 比 等 价 的 TRC 查 询 直 观 ， 对 较 复杂 的 SQL 也 没有 多 少 帮助 。 事 实 上 ， 
把 6.2.3 节 中 的 SQL 查 询 (CRARETEW) 翻译 为 代数 查询 不 是 一 个 简单 的 任务 。 更 重要 
的 是 ， 关 系 代数 并 不 是 有 助 于 把 SQL 数据 库 查 询 翻 译 成 英语 来 检验 它们 是 否 如 期 工作 的 理解 
工具 。 

尽管 英语 描述 没有 数学 规范 那么 正式 ， 但 是 它 也 有 自己 的 优点 ， 就 是 顾客 和 程序 员 都 很 
容易 理解 它 并 因此 共同 确认 它 与 他 们 的 目标 相对 应 。 但 如 何 确 定 给 定 的 SQL 查 询 满足 英语 规 
范 呢 ? 我 们 可 以 进行 如 下 推理 。 当 且 仅 当下 列 条 件 满足 时 ，SQL 查 询 符 合 英语 规范 : 

1) 对 于 根据 英语 表述 必须 在 查询 结果 中 的 每 个 元 组 :， 有 办 法 为 FROM 子 句 中 的 元 组 变量 
分 配 元 组 ， 让 这 些 元 组 满足 WHERE 条 件 并 且 查 询 目 标 列 表 判 定 为 1 (在 用 那些 元 组 替换 元 组 
变量 后 )。 

2) 由 SQL 查 询 产 生 的 每 个 元 组 都 在 英语 表述 的 结果 中 。 

应 用 这 些 条 件 的 主要 困难 是 确定 给 变量 分 配 特定 的 元 组 以 满足 WHERE 条 件 意味 着 什么 。 
在 简单 的 情况 下 你 可 以 靠 直觉 ， 但 是 对 于 (6.24) 这 样 较 复 杂 的 SQL 查询 ， 那 就 越 来 越 容 易 出 
错 了 。 

幸运 的 是 ， 这 个 困难 是 可 以 解决 的 ， 因 为 SQL 和 TRC 之 间 存 在 紧密 的 对 应 关系 。 给 定 一 
个 SQL 查询 ， 其 思想 是 首先 构造 一 个 等 价 的 TRC 查 询 ， 然 后 把 它 翻 译 成 英语 。 因 为 TRC 相 对 
英语 来 说 ， 更 加 接近 于 SQL， 所 以 更 有 可 能 正确 地 做 好 第 一 步 。 下 一 步 是 将 TRC 翻 译 为 英语 ， 
这 实际 上 是 已 经 经 过 良好 定义 的 过 程 (在 很 多 关于 谓词 逻辑 的 书 里 已 经 进行 了 解释 )， 它 可 以 
由 计算 机 来 执行 


as 


但 ”追溯 到 20 世 纪 70 年 代 ， 当 时 第 一 个 关系 系统 还 正在 实验 室 中 研制 ， 那 时 就 希望 基于 关系 演算 的 语言 能 够 提 
供 相当 高 层次 的 编程 ， 这 样 即使 非 技 术 用 户 ( 如 公司 的 CEO) 也 能 使 用 它们 。 不 用 说 ， 甚 至 在 二 十 年 之 后 
这 个 希望 还 没有 实现 ， 而 SQL 随 着 每 一 次 新 的 发 布 却 变 得 越 来 越 复 杂 。 
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用 这 种 方法 ， 检 验 SQL 查 询 的 问题 就 简化 为 把 SQL 翻译 成 TRC 的 问题 。 在 简单 的 情况 下 ， 
这 个 翻译 是 很 容易 的 。 我 们 现在 用 带 姓 套子 查询 的 一 个 复杂 SQL 查 询 的 例子 来 说 明 这 一 思想 。 
落 虑 下 面 的 查询 模板 ， 为 了 明确 起 见 我 们 假设 REL1 的 属性 是 A、B ，REL2 的 属性 是 C、D，， 
REL3 和 REL4 分 别 具 有 属性 E、F 和 G、H。 


SELECT R1.A, R2.C 
FROM REL1 R1, REL2 R2 
WHERE Condition1(R1, R2) AND 
R1.B IN (SELECT R3.E (7.8) 
FROM REL3 R3, REL4 R4 
WHERE Condition2 (R2,R3,R4)) 


在 这 个 模板 里 ， 变 量 R3 和 R4 对 于 子 查询 来 说 是 局 部 的 ， 变 量 R1 和 R2 是 全 局 的 。 另 外 ， 子 
查询 的 WHERE 条 件 用 到 了 变量 R2、R3、R4 (这 就 是 符号 Condition2 (R2, R3, R4) 想 表达 的 )。 
因为 R2 是 Condition2 用 到 的 全 局 变量 ， 它 是 内 层 子 查 询 的 参数 。 

我 们 假设 Condition1 是 很 适合 TRC 的 形式 ( 即 它 是 关系 代数 中 的 合法 选择 条 件 )。 然 而 ， 
代 套 子 查询 显然 不 是 TRC 可 以 理解 的 形式 。 不 过 ， 把 它 翻 译 成 TRC 是 很 简单 的 。 为 了 说 明 这 
一 点 ， 回 忆 一 下 前 面 对 关系 视图 的 讨论 。 

我 们 来 把 (7.8) 中 的 内 层 子 查 询 表示 成 视图 ， 即 已 命名 的 虚拟 视图 (ATEM), KE 
储 视图 的 内 容 ， 而 是 由 查询 计算 得 到 视图 的 内 容 。 这 里 需要 注意 一 个 细节 : 可 以 使 用 的 TEMP 
的 正确 的 属性 集 是 什么 ?我 们 不 能 只 是 从 内 层 子 查询 ( 即 E) 的 目标 列表 中 取出 属性 ， 因 为 内 
ETEW (和 它 的 结果 ) 被 全 局 变量 R2 参 数 化 了 。 回 忆 一 下 ， 条 件 中 的 自由 变量 是 那些 在 目 
标 列 表 中 已 命名 的 变量 ( 因为 一 旦 给 目标 变量 的 值 做 了 替换 ， 条 件 必 须 判 定 为 真 或 假 )。R2 必 
须 是 自由 的 ， 因 为 在 外 层 查 询 中 给 它 分 配 了 一 个 值 。 因 此 ，TEM? 正 确 的 属性 集 除了 内 层 子 查 
询 的 目标 列表 ( 即 E) 中 的 属性 外 ， 还 必须 包括 REL2 的 属性 (CHD) 。 。 这 个 推理 引出 了 下 
面 TEMP 的 视图 定义 : ` 


TEMP = {R3.E, R2.C, R2.D | REL2(R2) AND REL3(R3) (7.9) 
AND SR4EREL4 (Condition? (R2,R3,R4))} . 


在 这 里 ， 变 量 R2 和 R3 是 自由 的 ,但 是 R4 必 须 被 量化 ， 因 为 它 不 在 查询 的 目标 列表 中 出 现 。 
现在 ,将 (7.8) 翻译 为 TRC 的 结果 是 


{R1.A, R2.C | ReLi(R1) AND REL2(R2) AND Condition1(R1,R2) AND 
I3RETEMP (R.E = R1.B AND R.C = R2.C (7.10) 
AND R.D = R2.D)} 


这 个 TRC 查 询 是 如 何 表达 条 件 R1.B IN (SELECT R3.E...) HR? 通过 等 式 R.E = RIB. 
事实 上 ， 当 且 仅 当 这 些 元 组 分 别 属于 关系 REL1 和 REL2， 并 且 <b, c, d> 是 TEMP 中 的 元 组 时 ， 为 
R1 指 定 元 组 <a, b> 和 为 R2 指 定 元 组 <c, d > 满足 (7.10) 中 的 条 件 。TEMP 表 示 (7.8) 中 内 层 子 
查询 。 但 是 b 是 R1.B 的 值 ， 这 意味 着 b 必 须 是 内 层 子 查询 的 结果 。 

再 看 另 一 个 例子 ， 考 虑 较 复 杂 的 查询 (6.24)， 它 返回 选修 过 计算 机 系 每 个 教授 教 的 一 门 
课程 的 所 有 学 生 的 Id4。 这 里 我 们 要 构造 两 个 视图 ， 即 为 (6.24) 的 每 个 子 查询 构造 一 个 视图 。 


但 ”实际 上 ， 我 们 只 需要 包含 REL2 的 那些 在 Condition2 中 实际 用 到 的 属性 。 也 就 是 说 ， 如 果 Condition2 用 到 
R2.C， 但 没有 用 到 R2.D， 那 么 TEMP 的 属性 集 就 不 需要 包含 R2.D (不 过 包含 它 也 没有 什么 坏处 )。 





第 一 个 视图 CSPROF 是 很 简单 的 : 
CSPROF = {P.ProfId | PROFESSOR(P) AND P.Dept ='CS'} 
这 个 视图 的 结果 是 计算 机 系 所 有 教授 的 1d 的 集合 。( 6.24) 的 第 二 个 子 查询 返回 教 过 Id 为 
R.StudId 的 学 生 某 门 课 的 所 有 教授 的 Id 的 集合 ， 这 里 R 是 参数 化 子 查询 的 变量 。 因 为 之 前 解释 
过 ， 与 这 个 子 查询 相应 的 TRC 视 图 必须 在 目标 列表 中 包括 R: 
PROFSTUD = {T.ProfId, R.StudId | TEACHING(T) AND TRANSCRIPT(R) AND 
AR1LETRANSCRIPT (T.CrsCode = R1.CrsCode AND 


T.Semester = R1.Semester AND 
R.StudId = Ri.StudId)} 


最 后 ， 整 个 查询 (6.24) 能 够 重 述 如 下 : 我 们 想 找 这 样 的 学 生 s， 在 CSPRoF 中 不 存在 某 个 
教授 c ， 使 得 元 组 <c, s> 不 在 PROFSTUD 中 。 用 TRC 来 表达 这 个 查询 有 点 麻烦 。 


{S.StudId | STUDENT(S) AND NOT (3CeCSPROF (NOT(3PEPROFSTUD 
(P.ProfId = C.ProfId AND P.StudId = S.StudId))))} 


如 果 我 们 回忆 一 下 在 标准 逻辑 里 NOT 3 XNOT 等 价 于 X， 那 么 这 个 表达 式 可 以 被 简化 为 : 


{S.Studid | SruDENT(S) AND VCeCSpror 3PePROFSTUD 
(P.ProfId = C.ProfId AND P.StudId = §.StudId)} 


这 个 语句 可 以 表述 为 : 当 且 仅 当 对 于 每 个 计算 机 科学 系 的 教授 c 来 说 ， 元 组 <c, s> 在 视图 
PROFSTUD 中 ， 即 c 教 过 s， 那 么 学 生 Id s 在 这 个 查询 的 结果 中 。 

现在 把 它 和 (6.24) 中 最 初 的 表述 比较 一 下 : 找 出 选修 过 计算 机 系 每 个 教授 教 的 一 门 课 的 
所 有 学 生 。 这 两 个 句子 具有 相同 的 含义 ， 这 就 意味 着 我 们 验证 了 这 个 复杂 的 SQL 查 询 。 


7.3 域 关系 演算 和 可 视 化 查询 语言 


元 组 关系 演算 已 经 成 为 像 SQL 这 样 的 文本 数据 库 查 询 语言 的 基础 。 关 系 演 算 的 另 一 个 分 
支 是 域 关 系 演 算 (Domain Relational Calculus，DRC ) ， 它 已 经 成 为 像 IBM 的 Query-By- 
Example 这 样 的 可 视 化 查询 语言 和 像 Microsoft 的 Access、Borland 的 Paradox 这 样 的 PC 数据 库 语 
言 的 基础 了 。 。 

DRC 和 TRC 非 常 相 似 。 主 要 的 区 别 在 于 DRC 在 查询 中 使 用 了 域 变 量 (domain variable), 
而 不 是 元 组 变量 。 回 忆 一 下 ， 元 组 包含 了 一 组 命名 的 属性 ， 每 个 属性 从 某 个 域 中 取 值 。 域 变 
量 从 某 个 属性 的 域 中 取 值 。 例 如 ，TEACHING 关 系 可 能 有 名 为 Profid 的 属性 ， 它 的 域 由 有 效 的 Id 
组 成 。Pid 可 以 成 为 域 变量 ， 它 从 有 效 Id 的 域 中 取 值 。 

和 TRC 相 似 ，DRC 查 询 的 输出 是 一 个 关系 ，DRC 查 询 的 通常 形式 是 

{X,, +++, X, | Condition} 


其 中 ， Xi, …, X, 是 一 组 域 变量 (不必 互 不 相同 )， 它 们 形成 了 查询 的 目标 部 分 ，Condition 
是 查询 条 件 ， 看 起 来 和 TRC 中 的 查询 条 件 一 样 。 这 里 有 一 个 例子 : 


{Pid, Code | TEACHING(Pid,Code,F1997)} 


O 在 TRC 或 者 DRC 中 并 没有 什么 固有 的 东西 使 得 一 种 形式 比 另 一 种 形式 更 适合 于 一 种 特定 的 查询 语言 。 选 择 
TRC 作 为 SQL 的 基础 只 是 历史 的 偶然 。 





7# GEENI: KARAKRTALS HEF 141 


R 


它 实 质 上 和 下 面 的 TRC 查 询 是 一 样 的 。 

{T | TEACHING(T) AND T.Semester = 'F1997'} 

但 是 它 更 为 简单 ， 因 为 我 们 可 以 把 常数 F1997 直 接 放 进 条 件 TEACHING (Pid, Code, F1997) 中 ， 
从 而 就 不 需要 T.Semester = 'F1997' 了 。 这 样 的 替换 经 常 使 得 DRC 查 询 更 加 简洁 ， 也 比 它们 的 
TRC 等 价 表达 更 加 容易 理解 。 

因为 DRC 和 TRC 十 分 相近 ， 它 们 用 到 的 许多 特性 和 技术 或 者 相同 ， 或 者 非常 类 似 。 因 此 ， 

我 们 将 不 像 讨论 TRC 那 样 详细 地 讨论 DRC。 

1. DRC 查 询 条 件 的 语法 

DRC 中 的 查询 条 件 的 一 般 语法 类 似 于 在 TRC 所 介绍 的 语法 。 基 本 的 构造 块 有 以 下 几 种 

形式 : 

eP (X, …, X,)， 这 里 P 是 关系 名 称 ，X1, …, X, 是 域 变 量 。 直 观 地 ，P (X, …, %,) 表 示 测 试 
元 组 <X1,…, X 必 是 否 属于 P 的 关系 实例 〔 就 像 在 TRC 中 那样 ， 这 个 表达 式 是 在 为 X1,…, Xn 
选择 了 某 个 特定 的 值 之 后 才 计 算 的 )。 例 如 ，STUDENT (Sid, N, A,S)。 

。X oper Y， 这 里 oper 是 比较 运算 符 (=、>、> 、# 等 )， XX 和 了 7 是 域 变量 。 这 里 是 指 将 X 的 
值 和 Y 的 值 进行 比较 。 例 如 : Sid > Pid。 注 意 ， 因 为 域 变量 直接 表示 元 组 分 量 ， 我 们 不 
需要 像 在 TRC 中 那样 给 X 和 Y 加 上 关系 名 称 的 前 级 (比如 ，A.Sid = B.Pid ) 。 

° X oper const， 它 类 似 于 前 面 的 形式 ， 但 是 这 里 的 比较 是 和 常数 比 ， 而 不 是 和 变量 比 。 例 
an: X='F1994'。 

这 些 基 本 构造 块 称 为 原子 条 件 (atomic condition)， 更 为 复杂 的 查询 条 件 是 由 如 下 原则 递归 构 
造 而 成 的 : 

*。 如 果 C 是 原子 条 件 ， 那 么 它 是 查询 条 件 。 

“如 果 Ci 和 C: 是 查询 条 件 ， 那 么 C, AND C, Ci OR CHANOT Ci 也 是 查询 条 件 。 

。 如果 C 是 查询 条 件 ，R 是 关系 名 称 ，X 是 域 变量 ， 那 么 VX E R.A(C) 和 3X E R.4(C) 也 是 查 
询 条 件 。 

这 里 的 量词 类 似 于 TRC 中 的 量词 ， 只 有 一 点 不 同 : 表达 式 R.4 表 示 关 系 R 的 4 列 ， 变 量 X 的 

取 值 范围 是 出 现 于 该 列 的 值 。 换 名 话说 ，VX E R.A(C) 表 示 对 干 出 现在 关系 R (在 当前 的 数据 
库 实例 中 ) 的 4 列 上 的 所 有 值 ， 条 件 C 必 须 为 真 。 表 达 式 3X E R.4(C) 表 示 ， 在 列 R.4 上 至 少 有 
一 个 值 x， 使 得 如 果 用 zx 替换 出 现 的 X， 则 C 为 真 。 

自由 变量 和 绑 定 变量 的 规则 和 TRC 中 的 规则 是 一 样 的 ， 并 且 像 在 TRC 中 那样 ， 只 允许 目 

标 变量 在 查询 条 件 中 自由 出 现 。 为 了 让 这 个 规则 更 加 灵活 ， 我 们 也 允许 常数 出 现在 目标 中 。 
BAP, E 


{ Xi, ©, X, | Condition} (7.11) 
Hh, AX, (i = 1, …,m) 或 者 是 出 现在 Condition 中 的 自由 变量 ,或 者 是 常数 。 没 有 其 他 变量 
自由 出 现在 Condition 中 。 


查询 (7.11) 在 给 定数 据 库 上 定义 的 查询 结果 类 似 于 TRC 查 询 中 的 那样 : 它 是 元 组 
<x, RIAA ERRA, KARRA, MARX, Condition RAR. mR 
某 个 X 是 常数 ， 就 不 进行 替换 : 查询 结果 在 所 有 元 组 的 第 ;个 位 置 上 有 这 个 常数 。 
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2. 例子 

为 了 说 明 DRC 的 使 用 以 及 说 明 它 和 TRC 的 区 别 ， 我 们 用 了 说 明 关系 代数 和 TRC 时 用 到 的 
同一 套 查询 。 . 

DRC 查 询 用 到 的 变量 通常 比 与 它们 对 应 的 TRC 查 询 更 多 ， 因 为 DRC 变 量 是 在 简单 的 值 上 
变化 的 ， 而 TRC 变 量 是 在 元 组 上 变化 的 。 因 此 ， 一 个 TRC 变 量 可 以 有 效 地 代表 几 个 DRC 变 量 。 
结果 ，DRC 查 询 常常 使 用 更 多 的 量词 。 但 是 ， 有 几 种 方法 可 以 让 符号 变 得 更 为 简洁 。 一 个 办 
法 是 引入 全 称 域 (universal domain) VU， 它 包含 了 所 有 域 中 的 所 有 值 ， 这 样 我 们 不 用 写成 
JX € U (Condition)， 而 可 以 用 简略 的 表示 方式 3X (Condition). 

全 称 域 如 此 有 用 的 一 个 原因 是 任何 形 如 3X E R.A;(R【《(…, 关 ,…) …) 的 表达 式 (这 里 4， 
是 RR 的 属性 ， 它 相应 于 X 的 出 现 ) 等 价 于 3X (R(…, XL) …)。 换 句 话说， 我 们 可 以 用 全 称 
域 U 来 奉 换 域 R.A;。 当 然 ，U 包 含 了 R.A;， 但 是 它 可 能 大 得 多 。 然 而 ，X 的 任何 超出 R.A 的 选择 
x， 都 不 能 使 3X (R (…, 关 ,…) …) 结果 为 真 ， 因 为 为 了 让 有 R (…,x, …) 为 真 ， x 必须 是 R 的 
实例 中 某 个 元 组 的 4 的 值 ， 因 此 对 某 些 ;来 说 ，x 必 须 属于 R.4 的 域 。 

现在 让 我 们 回 到 7.1 节 的 查询 例子 。 与 查询 列 出 载 过 MGT123 的 所 有 教授 的 名 字 等 价 的 
DRC 是 


{N_| JIEPROFESSOR. Id 3DEPROFESSOR.DeptId ( 
PROFESSOR (I,N,D) AND 
ASETEACHING.Semester (TEACHING(I, MGT123, S)))} 


粗略 地 看 一 下 这 个 查询 就 可 以 清楚 地 看 出 全 称 域 的 作用 : 舍弃 了 长 长 的 域名 称 使 得 查询 
更 为 简洁 。 我 们 可 以 在 下 面 的 例子 中 利用 这 个 性 质 。 
下 一 个 查询 返回 教 过 Homer Simpson 的 所 有 教授 的 名 字 。 


{Pname | 3Pid 3Dept (PROFFSSOR(Pid, Pname, Dept) AND 
3Grd 3Crs 3Sem 3Sid 3Addr 3Stat (TEACHING(Pid, Crs, Sem) 
AND TRANSCRIPT(Sid, Crs, Sem, Grd) 
AND STUDENT(Sid, Homer Simpson, Addr, Stat)))} 


把 上 面 两 个 查询 和 它们 相对 应 的 TRC 进 行 比较 是 很 有 指导 作用 的 。DRC 查 询 通常 需要 更 
ZEEE, (ABER aOR, Aur, = R2z.4ttrz 的 分 量 。 然而 ， 基于 DRC 和 TRC 而 构建 的 商 
业 数 据 库 语 言 不 显 式 使 用 量词 。 事 实 上 ， 所 有 不 显 式 出 现在 查询 的 目标 列表 中 的 变量 都 假设 
被 3 隐 式 地 量化 ， 并 在 全 称 域 上 变化 。 利 用 这 个 规则 ， 上 面 的 DRC 查 询 中 的 所 有 量词 都 可 以 合 
弃 。 例 如 ， 第 二 个 查询 变 成 为 

{Pname | (PROFESSOR(Pid, Pname, Dept) 

AND TEACHING (Pid, Crs, Sem) 
AND TRANscRIPT(Sid, Crs, Sem, Grd) 
AND STUDENT(Sid, Homer Simpson, Addr, Stat))} 

相 比 而 言 ，TRC 量 词 在 不 对 查询 做 进一步 修改 的 情况 下 是 不 能 舍弃 的 ， 否 则 在 某 些 情况 
下 我 们 可 能 丢失 关于 相应 量化 变量 的 有 用 信息 。 为 了 说 明 这 个 问题 ， 我 们 再 来 看 看 关于 教 过 
MGT123 的 教授 的 TRC 查 询 。 


{P.Name | PROFESSOR(P) AND 
I3TETEACHING (P.Id = T.ProfId AND T.CrsCode = 'MGT123')} 
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这 里 舍弃 3T E TEACHING 将 会 使 T 变 成 “未 声明 ”( 编程 语言 的 术语 )， 因 为 我 们 丢失 了 T 的 
变化 范围 是 TEAcHING 这 样 的 信息 。 变 化 范围 信息 在 DRC 中 是 不 会 丢失 的 ， 因 为 未 声明 的 变量 
都 假设 是 在 全 称 域 上 变化 。 然 而 ， 注 意 到 3T E€ TEACHING (…) 等 价 于 3T € TEACHING 
(TEACHING (T) AND …)， 我 们 可 以 把 这 个 查询 重 写 为 


{P.Name | PROFESSOR(P) AND 
TEACHING(T) AND P.Id = T.ProfId AND T.CrsCode = 'MGT123'} 


如 果 我 们 假设 非 目标 变量 的 T 隐 式 地 由 3 量化 ， 那 么 这 个 公式 就 是 正确 的 。 

当 在 DRC 或 TRC 中 舍弃 存在 量词 的 时 候 ， 如 果 3 和 V 都 出 现在 同一 个 查询 中 ， 则 很 可 能 存 
在 不 明确 性 。 例 如 ， 考 虑 VY (Likes (X, Y))， 这 里 LIKES (X, Y) 意味 着 X 类 似 于 7Y。X 隐 含 
地 由 3 来 量化 这 条 规则 还 让 我 们 面临 了 两 难 的 选择 : 这 个 表达 式 表 示 VY3X (Likes) (X, Y) 
还 是 3XVYLIKES (X, Y) ? 思考 一 下 就 可 以 知道 ， 这 两 个 表达 式 对 应 着 两 个 完全 不 同 的 句子 : 
每 个 7 都 与 某 个 X 相 似 和 某 个 X 与 每 个 7 者 相似。 因此， 在 一 些 情况 下 是 不 可 以 舍弃 量词 的 。 这 
种 二 义 性 不 会 在 SQL 中 出 现 ， 因 为 SQL 不 允许 使 用 Y， 因 为 优化 这 样 的 查询 是 很 困难 的 。 事 
实 上 ， 如 果 程 序 员 提 交 的 查询 需要 用 到 VY 或 除法 运算 符 ， 那 么 它们 就 得 从 循环 中 跳出 来 。 

我 们 在 6.2 节 中 研究 了 克服 SQL 的 这 个 缺陷 的 技术 ， 但 是 在 利用 这 个 技术 之 前 ， 我 们 先 看 
看 如 何 用 DRC 来 表示 查询 找 出 选修 过 每 个 教授 的 一 门 课 的 所 有 学 生 。 


{Sid | YPideTEACHING.ProfId (3Crs 3Sem 3Grd ( 
TEACHING(Pid, Crs, Sem) AND (7.12) 
TRANSCRIPT(Sid, Crs, Sem, Grd)))} f 


这 个 DRC 查 询 实 质 上 比 相应 的 SQL 查询 (6.24) 和 TRC 查 询 (7.4) 要 简单 。 特 别 是 不 必 
两 次 提 到 TEAcHING。( 回 忆 一 下 在 TRC 中 ，TEAcHING 因 为 不 明确 的 原因 而 必须 出 现 两 次 。) 注 
意 ,在 (7.12) 中 我 们 显 式 地 用 到 3， 来 避免 因为 Y 和 3 出 现在 同一 个 查询 中 而 引起 的 二 义 性 。 

还 有 一 点 必须 指出 ， 我 们 不 能 用 全 称 域 w 来 替换 变量 P.Id 的 域 TEAcHING.ProfId。 通 常 ， 
VXER.A; (R (-, X, …)) 并 不 等 价 于 VX (R (…, 处 ,…))。 用 UU 而 不 是 用 TEACHING.ProfId 意 
味 着 为 了 使 某 个 特定 的 值 sid 在 查询 (7.12) 的 结果 中 ， 条 件 TEAcHING (pid, crs, sem) AND 
TRANSCRIPT (sid, crs, sem, grd) 对 于 在 U 中 的 所 有 pid 值 和 某 些 crs、sem、grd 值 都 必须 为 真 。 
若 pid 是 U 中 的 一 个 值 但 它 又 不 和 任何 教授 的 1d 相对 应 是 不 可 能 的 (U 必 须 有 这 样 的 值 ， 因 为 它 
完全 包含 TEACHING.ProfId )。 然 而 ， 就 像 之 前 讨论 的 那样 ， 在 3X © R.A4,; 域 中 可 以 用 U 来 替换 
R.A;. 


7.4 可 视 化 查询 语言 : QBE 和 PC 数据 库 


QBE (Query-by-Example) 是 第 一 个 受到 广泛 欢迎 的 可 视 化 查询 语言 。 它 和 SQL 一 样 也 
是 由 [BM 开发 的 ， 开 发 时 间 大 约 与 [Zioof 1975] 相 同 。QBE 是 IBM 的 DB2 关 系数 据 库 产 品 的 一 
部 分 ， 其 他 一 些 供应 商 也 开发 过 QBE 的 类 似 产品 。 然 而 ， 可 视 化 查询 语言 最 大 的 成 功 是 伴随 
PC 数据 库 (如 Borland 的 Paradox 和 Microsoft 的 Access) 的 出 现 而 到 来 的 。 

在 这 一 节 中 ， 我 们 要 研究 QBE。 我 们 本 节 的 目标 是 强调 概念 ， 而 不 是 提供 详尽 的 参考 。 
在 本 节 的 最 后 一 部 分 ， 我 们 简单 讨论 一 下 Microsoft 的 Access ， 它 的 界面 也 是 基于 域 演算 ,但 


日 ”SQL:1999 引 入 了 全 称 量词 的 受 限 形式 。 
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是 比 QBE 更 为 自由 。 

1.QBE 的 基本 概念 

QBE 是 纯粹 的 理论 工具 一 一 域 演算 用 于 实际 应 用 的 最 好 例证 之 一 。QBE 的 主要 原理 是 用 
户 (他 可 能 不 是 程序 员 ) 通过 从 菜单 中 选择 关系 模板 ， 然 后 再 给 这 些 模 板 填 充 “ 样 例 元 组 ” 
(它们 指定 希望 的 结果 ) 来 指定 查询 。QBE 中 的 样 例 元 组 包含 变量 和 常数 ， 但 是 即使 是 变量 ， 
看 起 来 也 像 是 “常数 的 样 例 ”一 一 QBE 尽 量 避 免 了 编程 的 符号 。 。 

假设 你 想 找 出 在 MGT 系 中 的 所 有 教授 。 在 QBE 中 ， 你 选择 一 个 与 PROFESSOR 关 系 相 应 的 模 
板 ， 然 后 填 人 如 下 样 例 元 组 : 


P._John MGT i 


很 明显 ， 这 个 QBE 查 询 只 是 用 于 文本 方式 的 DRC 查 询 {Name | 3 I PROFESSOR (I, Name, 
MGT)} 的 不 同 的 可 视 化 表示 。 符 号 _John 是 伪装 的 域 变量 ， 而 MGT 是 常数 。 即 使 一 般 用 户 看 
起 来 这 两 个 符号 是 相似 的 ,但 前 级 “_” 也 显示 出 _Johih 作 为 不 同 寻常 的 变量 的 特殊 状态 。 另 
外 ， 表 示 打 印 的 运算 符 P. 指 明 _John 在 关系 演算 的 意义 上 是 目标 变量 ， 因 为 它 是 由 打印 命令 来 
输出 的 。QBE 使 用 几 个 运算 符 ， 通 常 表 示 为 关键 字 后 面 跟着 一 个 句点 ， 但 是 在 这 个 概述 中 我 
们 主要 使 用 P. 一 一 所 有 QBE 运 算 符 之 源 ， 它 把 目标 变量 从 其 他 部 分 分 离开 来 。 

我 们 之 前 提 到 商业 的 查询 语言 不 会 显 式 地 量化 变量 ， 当 然 我 们 在 QBE 查 询 中 找 不 到 量词 。 
事实 上 ， 所 有 的 非 目 标 变量 都 假设 为 隐 含 地 由 3 来 量化 。 然 而 ，QBE 更 进一步 : 可 以 省 略 一 些 
非 目标 变量 (如 上 面 查 询 的 DRC 版 本 中 的 I) 。 当 出 现 这 种 情况 时 ， 系 统 生 成 一 个 独一无二 的 
变量 名 ， 并 自动 地 把 它 赫 换 进 来 。 

实际 上 ， 即 使 变量 _John 也 不 是 必需 的 ， 我 们 可 以 舍弃 它 而 不 会 影响 最 终 的 结果 。 在 那 种 
情况 下 ，Name 列 只 包含 P.。 因 而 P. 可 以 像 独立 运算 符 那 样 在 查询 中 出 现 。 如 果 查 询 结果 必须 
是 具有 两 个 或 两 个 以 上 属性 的 关系 ， 我 们 可 以 把 P. 放 到 查询 的 几 个 地 方 。 如 果 关 系 的 所 有 属 
性 都 要 输出 ， 我 们 可 以 把 P. 直 接 放 到 关系 名 下 ， 而 不 是 放 在 每 个 列 里 。 


EE 

P. MGT 

2. 连接 和 高 级 查询 

上 面 的 查询 没有 显 式 地 提 到 任何 变量 。 然 而 我 们 通常 又 不 能 不 使 用 变量 。 如 果 查 询 中 需 
要 用 到 某 个 变量 两 次 或 两 次 以 上 ， 那 么 它 表示 在 相同 或 不 同 元 组 的 属性 之 间 的 相等 关系 ， 因 
此 不 能 省 略 它 。 经常 在 指定 等 值 联结 的 时 候 出 现 这 个 情况 。 下 面 是 类 似 的 查询 ( 列 出 教 
MGT123 的 所 有 教授 的 名 字 ) 的 QBE 版 本 : . 


-123456789 P. _John 


O QBE 尽 力 消 除 任何 编程 术语 的 痕迹 。 它 称 常量 为 “ 例 值 ”， 称 变量 为 “ 例 元 素 ”。 
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: 
123456789 MGT123 
这 里 的 _John 就 像 前 面 的 一 样 是 目标 变量 ，_123456789 是 由 3 隐 式 量化 的 变量 。 它 在 这 个 
查询 中 用 于 指定 两 张 表 的 等 值 联结 ， 因 此 不 能 省 略 。( 相 反 ，_John 像 前 面 一 样 可 以 省 格 。) 
我 们 已 经 看 到 ，QBE 让 用 户 通过 把 适当 的 常数 放 人 模板 来 指定 简单 的 选择 。QBE 更 进 一 
步 ， 人 允许 用 下 面 的 语法 来 找 出 Id 大 于 指定 常数 的 所 有 教授 的 名 字 。 


> 123456789 卫 . 





(注意 常数 123456789 和 变量 _123456789 之 间 的 差别 )。 然 而 ， 较 复杂 的 选择 或 联结 条 件 不 
能 通过 这 种 方式 来 指定 ， 所 以 QBE 提 供 了 特别 的 模板 (PARE, condition box), fA Pay 
以 在 条 件 框 里 用 类 似 于 关系 代数 的 语法 编写 任何 复杂 的 选择 和 联结 条 件 。 例 如 ， 为 了 得 到 选 
修 过 CS305 并 且 成 绩 为 A 或 B 的 所 有 学 生 的 Id4， 我 们 可 以 写成 如 下 形式 : 


P. 


C8305 -G -~G =A OR G=B 


因为 QBE 查 询 的 结果 是 关系 ， 在 P. 运 算 符 出 现 的 位 置 上 有 某 些 限制 。 特 别 地 ， 为 了 避免 P. 
可 能 放 在 不 同 关系 模板 的 两 个 同名 属性 之 下 ，QBE 要 求 P. 必 须 都 在 同一 个 模板 中 出 现 9 。 那 么 
FRAT ROH RG EE TRE A RV Be it FD 因为 教授 和 学 生存 储 在 不 同 的 关系 
中 ， 所 以 如 果 P. 的 所 有 形式 只 可 以 出 现在 两 个 模板 之 一 ， 它 就 不 能 回答 这 个 查询 。 

一 个 解决 方案 是 允许 用 户 构造 新 的 模板 ， 所 以 他 们 就 不 会 局 限于 数据 库 中 已 有 的 关系 模 
板 。 为 了 回答 上 面 的 查询 ， 用 户 使 用 菜单 系统 来 按 如 下 方式 定义 新 的 模板 HASTAUGHT: 


HASsTAUGHT Prof 





IL 123456789 987654321 
-987654321 _CS305 _F1996 . 
-123456789 _CS305 -F1996 


”模板 HAsTAUGHT 中 的 运算 符 世 (意味 着 插入 ) 指定 了 应 该 位 于 相应 表 的 元 组 ， 然 后 用 户 可 
以 按 如 下 方式 使 用 P. 运 算 符 来 查询 HAsSTAUGHT。 


P. 


日 ”这 是 一 个 相当 严重 的 限制 ， 引 入 它 是 为 了 解决 相对 小 的 问题 。 





3. 免费 午餐 的 代价 

前 面 的 例子 说 明了 正确 选择 可 视 化 原 语 和 规则 可 以 让 即使 是 非 专业 的 人 士 也 能 理解 域 关 
系 演 算 。 但 是 和 语言 设计 中 出 现 的 情况 类 似 ， 让 一 些 事 情 变 得 简单 的 特性 却 让 其 他 的 事情 变 
得 困难 。 就 数据 库 查 询 语言 而 言 ， 代 价 通常 是 表达 能 力 有 所 损失 〈 即 不 能 指定 某 些 类 型 的 查 
询 ) 或 者 是 指定 起 来 不 方便 。 在 QBE 的 情况 下 (实际 上 SQL 也 一 样 )， 当 需要 提交 涉及 到 除法 
运算 符 的 查询 (例如 找 出 数据 库 中 每 个 学 生 都 选修 过 的 所 有 课程 )， 就 必须 付出 代价 了 。 我 们 
在 后 面 再 说 到 这 个 查询 。 

因为 QBE 不 提供 全 称 量 词 Y， 所 以 它 使 用 否定 运算 符 来 构造 -3"， 它 表达 了 同样 的 意思 。 
为 了 说 明 这 一 点 ， 让 我 们 来 考虑 一 下 查询 列 出 在 1995 年 秋季 没有 教 过 一 门 课 的 所 有 教授 。 在 
DRC 中 ， 这 个 查询 既 可 以 表达 为 


{Name|PROFESSOR (Id, Name, DeptId) 
AND YCrsCode (NOT(TEACHING (Id, CrsCode, F1995)))} 


也 可 以 表达 为 : 


{Name|PROFESSOR (Id, Name, DeptId) 
AND NOT (SCrsCode (TEACHING (Id, CrsCode, F1995)))} 


在 这 两 种 情况 下 ， 我 们 都 假设 Id 和 DeptId 是 存在 量化 的 。QBE 选 择 了 第 二 个 公式 ， 它 表 
RA 
PROFESSOR Id 


123456789 P. 


> -123456789 F1995 





符号 “~” 表 示 否 定 运算 符 ， 它 出 现在 TEAcHING 模 板 中 ， 因 为 我 们 要 求 在 TEAcHING 中 没有 
哪 一 行 可 以 匹配 PROFESSOR 中 某 个 特定 Id。 这 个 否定 大 致 与 差 集 相 对 应 。 第 一 个 模板 产生 了 
PROFESSOR 关 系 中 所 有 教授 的 名 字 ， 第 二 个 模板 从 第 1 个 模板 的 集合 中 去 除了 在 1995 年 秋季 教 
过 一 门 课 的 那些 教授 。 这 个 查询 看 起 来 很 简单 ， 但 是 也 有 缺陷 。 前 面 我 们 说 过 ，QBE 中 的 所 
有 变量 都 是 由 3 隐 式 量化 的 ， 模 板 中 的 空白 列 事实 上 是 由 系统 产生 的 变量 (也 是 由 3 隐 式 量化 
的 ) 填充 的 。 对 于 否定 的 样 例 元 组 则 不 是 这 样 ! 事实 上 ， 如 果 系 统 产生 的 变量 (如 隐 式 出 现 
在 列 CrsCode 中 的 _Crs123) 是 存在 量化 的 ， 我 们 将 会 有 下 面 的 查询 : 


{Name | Id ADeptId 3CrsCode( 
PROFESSOR(Id, Name, DeptId) AND 
NOT TEACHING(Id, CrsCode, 'F1995'))} 


如 果 有 一 门 课 ， 比 如 是 MGT123， 则 行 <111111111, MGT123, F1995> 不 在 TEAcHING 中 ， 那 
么 这 个 查询 返回 一 个 I4， 即 11111111。 也 就 是 说 ， 它 返回 在 1995 年 秋季 没有 教授 某 门 课 的 所 有 
教授 的 Id 一 一 这 与 我 们 提交 过 的 查询 是 不 同 的 。 正 确 的 公式 是 


{Name | 3Id 3DeptId VCrsCode( 
PROFESSOR(Id, Name, DeptId) AND (7.13) 
NOT TEACHING(Id, CrsCode, 'F1995'))} 
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也 就 是 说 ，_Crs123 希 望 的 量化 是 全 称 的 。 

否定 元 组 中 对 变量 进行 正确 量化 的 不 确定 性 是 QBE 中 语义 问题 的 一 个 来 源 。 最 终 决 定 ， 
假设 否定 元 组 中 所 有 系统 生成 的 变量 都 隐 式 地 由 V 来 量化 。 做 出 这 个 决定 的 原因 是 我 们 认为 就 
像 在 前 面 的 例子 中 那样 ， 在 大 多 数 情 况 下 用 户 想 要 的 是 全 称 量化 。 

但 是 ， 这 个 简单 的 规则 仍然 没有 完全 解决 这 个 问题 ， 因 为 我 们 已 经 知道 3 和 Y 不 能 互 换 位 
置 。 所 以 存在 一 个 安排 量化 前 组 的 顺序 问题 。 例 如 ， 在 (7.13) 中 我 们 以 不 同 的 顺序 安排 量 
词 ， 并 得 到 了 一 个 不 同 的 查询 : 

{Name | YCrsCode 3Id 3DeptId( 


PROFESSOR(Id, Name, DeptId) AND (7.14) 
NOT TEACHING(Id, CrsCode, 'F1995'))} 


它 找 出 具有 下 面 性 质 的 所 有 教授 的 名 字 : 对 于 每 门 课 来 说 ， 存 在 一 个 教授 ， 他 没有 教 过 
这 门 特定 的 课程 。 

最 终 解决 了 QBE 的 语义 问题 ， 这 样 量化 前 缀 按 存在 量词 优先 的 原则 来 安排 顺序 。 因 而 之 
前 的 QBE 查 询 必须 解释 为 (7.13) 那样 。 

既然 我 们 理解 了 QBE 中 的 否定 ， 关 于 每 个 学 生 都 选修 过 的 课程 的 查询 就 可 以 按 如 下 方式 
表达 了 。 首 先 ， 我 们 要 找到 至 少 有 一 个 学 生 没 有 选修 过 的 课程 。 我 们 称 包 含 所 有 这 样 的 课程 
的 关系 为 NorTANSWER， 它 的 构造 方法 如 下 : 


I. -MGT111 -MGT111 


Te 
_123456789 


一 _123456789 _MGT111 





我 们 又 一 次 用 到 了 插入 运算 符 来 指定 我 们 想 插 入 到 关系 NoTANSwER 中 的 元 组 。 因 而 ， 
NoTANSWER 的 内 容 由 下 面 的 DRC 查 询 来 描述 。 


{CrsCode | 3CrsName ADescr Id 3Name 3Status JAddress 
VSemester VGrade( 
CoursE(CrsCode, CrsName, Descr) AND (7.15) 
STUDENT(Id, Name, Status, Address) AND 
NOT TRANSCRIPT(Id, CrsCode, Semester, Grade))} 


最 后 ， 为 了 得 到 最 初 查询 的 结果 , 我 们 要 从 CouRSsE 中 减 去 NoTANSWER。 


一 -MGT111 -MGT111 P. 


尽管 我 们 已 经 介绍 了 QBE 大 多 数 的 特性 ， 但 是 关于 QBE 还 有 一 些 我 们 没有 讨论 到 的 方面 
(或 者 只 是 简略 地 介绍 了 一 下 )。 例如，QBE 有 非常 方便 的 数据 定义 子 语 言 ， 其 可 视 化 的 外 观 
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和 查询 子 语言 保持 一 致 。 它 也 支持 聚合 函数 ， 如 统计 、 求 平均 值 ， 这 些 聚 合 函 数 以 运算 符 
(COUNT、AVG 等 ) 的 形式 提供 给 用 户 使 用 。 在 6.2 节 中 详细 讨论 过 聚合 函数 ， 但 是 该 节 重 点 
介绍 的 是 SQL, 而 不 是 QBE。 最 后 ， 我 们 已 经 看 到 了 运算 符 I.， 它 是 QBE 数 据 操纵 子 语言 的 一 
部 分 。 也 可 以 用 类 似 的 运算 符 来 删除 和 修改 元 组 。 

4. PC 数据 库 

从 概念 上 来 说 ， 如 果 你 已 经 看 到 过 一 种 可 视 化 查询 语言 ， 你 就 能 了 解 其 他 的 可 视 化 查询 
语言 了 。QBE 和 Borland Paradox 或 Microsoft Access 之 间 的 主要 差异 在 于 图 形 界面 的 细节 的 不 
同 。 图 7-1 描 绘 了 用 Access 的 “设计 模式 ”指定 的 查询 。 查 询 返 回 在 1995 年 秋季 开设 的 所 有 课 
程 以 及 教 这 些 课 的 教授 的 名 字 。 


a Microsoft Access 


SADESA aie N ee oak S 
ON E E Ee 





图 7-1 Microsoft Access 中 的 可 视 化 查询 — 


Access 努 力 试图 来 隐藏 其 关系 演算 的 本 源 。 为 了 指定 等 值 联结 ， 用 户 不 是 使 用 变量 ， 而 
是 把 一 个 属性 拖 到 另 一 个 属性 那里 去 ， 创 建 如 图 所 示 的 图 形 链接 ， 用 图 形 链接 来 表示 联结 条 
件 (如 PROFESSOR.Id = TEACHING.ProfId)。Access 有 类 似 于 QBE 的 条 件 框 的 表示 (如 准则 
TEACHING.Semester = 'F1995')。 在 Access 中 比 在 QBE 中 会 更 多 地 要 用 到 这 个 框 ， 特 别 是 指定 
QBE 中 要 借助 于 像 P. 这 样 的 运算 符 来 完成 工作 ( 见 图 7-1 中 标记 为 “Show: ”的 线 )。 

总 之 ，QBE 比 Access 更 为 灵活 ， 通 常 对 于 熟悉 关系 语言 的 数据 库 专家 也 更 为 直观 。 然 而 ， 
对 于 拖 放 的 生成 来 说 ，Access 的 设计 模式 较 容易 使 用 ， 至 少 对 于 简单 查询 是 这 样 。 


7.5 关系 代数 和 关系 演算 之 间 的 联系 


我 们 已 经 给 出 了 关系 代数 和 两 种 关系 演算 的 详细 描述 。 我 们 也 看 到 一 些 查询 在 二 种 语言 
中 看 起 来 比 在 另 一 种 语言 中 要 简单 。 我 们 会 很 自然 地 提出 这 样 的 问题 : 是 否 某 些 查询 只 能 用 
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其 中 的 一 种 语言 来 编写 ? 

注意 ， 这 并 不 是 没有 价值 的 理论 问题 。 回 忆 一 下 数据 库 管 理 系统 使 用 关系 代数 作为 SQL 
查询 翻译 的 中 间 代 码 ， 进 而 进行 优化 。 如 果 TRC 能 够 比 代数 表达 更 多 的 查询 ， 那 么 一 些 SQL 
查询 就 可 能 没有 代数 的 对 应 体 ， 因 而 就 不 可 实现 了 。 类 似 的 ， 如 果 DRC 能 够 比 TRC 表 达 更 多 
的 查询 ， 那 么 它 就 能 够 成 为 葛 定 数据 库 语言 基础 的 更 好 平台 。 

上 述 问 题 的 答案 是 ， 这 三 种 语言 有 着 完全 相同 的 表达 能 力 : 能 以 一 种 语言 提交 的 查询 几 
平 都 能 以 另 一 种 语言 来 提交 。 事 实 上 ， 演 算 的 表达 能 力 更 强 一 些 ， 但 是 在 实际 的 数据 库 查询 
中 很 少 用 到 那些 额外 的 表达 。 

为 了 进行 说 明 ， 考虑 一 下 查询 {T 1 NOT Q(T)}， 它 要 求 返 回 不 在 关系 Q 中 的 所 有 元 组 。 从 
直观 上 看 ， 这 并 不 是 通常 针对 数据 库 中 的 数据 的 查询 。 但 是 对 于 我 们 讨论 来 说 ， 更 重要 的 是 
CA ASE ERE. 例如 , 假设 Q 是 包含 一 组 学 生 名 字 的 关系 , 名 字 的 域 是 CHAR (20). 
那么 {T | NOT Q(T)} 的 结果 就 是 除了 Q 中 的 那些 字符 串 以 外 所 有 最 多 由 20 个 字符 构成 的 字符 
串 的 集合 。 现 在 假设 名 字 的 域 后 来 成 为 所 有 最 多 由 30 个 字符 构成 的 字符 串 的 集合 。 那 么 即使 
数据 库 实例 没有 变化 ， 上 面 查 询 的 答案 也 发 生 了 改变 。 

在 查询 条 件 包含 析 取 的 时 候 可 能 出 现 查询 答案 依赖 于 域 的 情况 。 例 如 {T | 3S(Q(T)OR 
R(S))} 在 R 是 空 关 系 的 时 候 ， 将 返回 Q@ 中 所 有 元 组 的 集合 。 然 而 ， 如 果 了 R 即 使 只 包含 一 个 元 组 ， 
那么 这 个 查询 的 答案 就 是 所 有 可 能 的 "元 元 组 的 集合 ， 这 里 的 ?是 Q 中 属性 的 数目 。 在 这 种 情 
AT: 查询 的 答案 依赖 于 Q 中 属性 的 域 。 

当 域 变 化 而 结果 仍然 保持 不 变 的 数据 库 查 询 称 为 域 独 立 的 (domain-independent) 。 练 习 
7.4 说 明了 用 关系 代数 表达 的 查询 总 是 域 独立 的 。 然 而 ， 我 们 刚刚 看 到 可 以 用 关系 演算 来 表达 
域 独立 的 查询 。 即 使 这 样 ， 也 可 以 得 到 如 下 的 结论 

以 两 种 演算 中 任何 一 种 方法 表达 的 每 个 域 独立 的 查询 都 可 以 翻译 成 用 关系 代数 编写 

的 等 价 查询 ， 反 之 亦 然 。 

这 个 结论 的 第 一 部 分 并 不 能 明显 地 看 出 其 正确 性 。 在 [Ullman 1988] 中 有 它 的 证 明 。 然而 ， 
另 一 个 方向 ， 从 代数 到 演算 的 翻译 是 很 容易 的 ， 也 是 一 个 很 好 的 练习 ， 因 为 它 显 示 了 关系 代 
数 的 运算 符 是 如 何 与 关系 演算 的 构造 成 分 相关 联 的 。 

。 选 择 

代数 : O condition (R) 
TRC: {TIR(T) AND Condition} 
DRC: {X,,--,X, | R (Xj,-~,X,) AND Condition,} 

在 TRC 中 ，Conditiom 是 通过 用 T 的 适当 分 量 替 换 属 性 而 从 Condirion 得 到 的 。 例 如 ， 如 果 
Condition 是 A =B AND C = d， 这 里 A、B、C 是 属性 ，d 是 常数 ， 那 么 Conditiom 就 是 TA = 
T.B AND T.C xd. 

在 DRC 中 ，Conditiom 是 通过 用 适当 变量 替换 出 现在 Comndirion 中 的 属性 而 得 到 的 。 例 如 ， 
如 果 A 是 R 的 第 一 个 属性 ，B 是 第 二 个 属性 ，C 是 第 三 个 属性 ， 那 么 Comndition? 就 是 X = X, 
AND X; = d. 
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° 
代数 : aas c (R) 
TRC: {T.A,T.B,T.C!R (T) } 
DRC: {X, Y,Z|3V4aW (R (X, Y,Z,V,W)) } 
这 里 我 们 假设 R 有 五 个 属性 ， 并 且 A、B 、C 是 前 三 个 属性 。 

°. K FOLA 
代数 : R xS 
TRC: {TA,TB,TC,VD,VEIR (T) ANDS (V) } 
为 了 明确 起 见 ， 我 们 假设 R 有 属性 A、B、C，S 有 属性 D、E。 
DRC: {X,YZ,VWIR (X,Y,Z) ANDS (V,W) } 

。 并 
代数 : RUS 
TRC: {TIR (T) ORS (T) } 
DRC: { Xi, °°, Xa |R (Xi, +, Xa) OR S (Xi, 04, Xa)} 

注意 因为 R 和 S$ 必须 是 并 相 容 的 ， 这 样 U 运算 符 才 有 意义 ， 所 以 两 个 关系 模式 必须 具有 相同 的 
元 数 。 

。 差 集 
KR: R-S 
TRC: {TIR (T) AND (NOT S (T)} 
DRC: 练习 7.6 

。 如 果 不 讨论 除法 运算 符 ， 关 系 代数 的 讨论 是 不 完整 的 。 
RÆ: R/S， 这 里 R 具 有 属性 A、B，S 只 有 属性 B。 
TRC: {TATIR (T) AND VX ES (AY ER (Y.B = X.B AND Y.A = T.A))} 
DRC: 4217.6 


7.6 SQL:1999 中 的 递归 查询 


1. 关系 查询 语言 的 局 限 性 

本 章 和 前 面 的 几 章 中 的 许多 例子 说 明了 关系 查询 语 
言 的 强大 表达 能 力 。 然 而 这 些 语言 的 表达 能 力 并 不 足以 
使 程序 员 用 SQL 来 编写 全 部 的 应 用 程序 。 令 人 惊奇 的 是 ， 
SQL 其 至 不 能 用 来 表达 一 些 非常 常见 的 查询 ， 如 一 门 课 
是 否 是 另 一 门 课 的 ( 可 能 是 非 直 接 的 ) 预备 课程 。 

为 了 说 明 这 个 问题 , 考虑 一 下 图 7-2 中 的 关系 PREREQ。 
假设 我 们 想 知道 CS113 是 否 是 CS632 的 预备 课程 。 我 们 可 
以 利用 关系 代数 试 着 用 如 下 方法 解决 这 个 问题 。 让 
PREREQ (Crs, PreCrs) 表示 表达 式 图 7-2 预备 课程 列表 








Tors,ProCrs((PREREQ >precrs—Crs PREREQ) [Crs ,P1,C2,PreCrs]}) 
U PREREQ 
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这 里 [Crs, P1, C2, PreCrs] 像 前 面 一 样 对 属性 重 命 名 。 我 们 现在 可 以 计算 表达 式 
O crs ='Cs632' AND PreCrs = 'Cs1l13 (PREREQ2) ， 并 看 看 结果 是 否 不 为 空 。 如 果 不 为 空 ，CS113 就 是 CS632 
的 预备 课程 。 然 而 ， 容 易 验 证 上 面 的 表达 式 在 我 们 这 个 具体 的 情况 下 计算 得 到 一 个 空 关系 ， 
所 以 我 们 还 没有 做 完 。 . 

我 们 试 着 计算 下 面 的 表达 式 来 看 看 CS113 是 否 是 CS632 的 预备 课程 ， 我 们 把 它 表示 成 
PREREQ (Crs, PreCrs). 


Tors PreCrs ( (PREREQ bdprecrs=CrsPREREQ>) [Crs,P1,C2,PreCrs]) 
U PREREQ, 


如 果 G crs = csaz AND PreCrs = 'cs113 (PREREQ;) 不 为 空 ， 那 么 就 证 实 了 我 们 的 假设 。 然 而 ， 这 个 
表达 式 又 一 次 为 空 ， 所 以 我 们 还 没有 在 这 两 门 课 之 间 建 立 起 间接 的 预备 课程 关系 。 如 果 我 们 给 
关系 PREREQ 赋 了 予 别 名 PREREQ:， 我 们 可 以 看 出 在 上 面 过 程 中 每 次 重复 的 模式 看 起 来 都 如 下 所 示 : 

了 PREREQi+1 = ` 


N Crs PreCrs ( (PREREQ D<preCrs=Crs PREREQi) [Crs ,P1,C2,PreCrs]) (7.16) 
U PREREQ; 


我 们 继续 用 同样 的 方法 创建 PREREQ4、PREREQs 等 等 。 容 易 直 接 验 证 a crs ='Cs632 AND PreCrs = 
csll3 (PREREQ;) 不 为 空 ， 因而 这 两 门 课 具 有 预备 课程 关系 o 

注意 ， 上 面 的 过 程 也 可 以 用 来 提供 否定 的 答案 。 例 如 ， 为 了 验证 CS220 不 是 CS505 的 直接 
或 间接 的 预备 课程 ， 我 们 可 以 计算 PREREQ，,、PREREQ; 等 等 ， 来 看 看 在 每 种 情况 下 应 用 选择 
© crs = 'Cs505' AND Precrs = 'Cs220' 都 产生 空 的 结果 。 我 们 怎么 知道 Gcss = cssos AND Precrs = 'cs220 (PREREQi000) ` 
是 不 是 为 空 呢 ? 这 很 简单 : PREREQ;、PREREQ6 等 等 都 是 相等 的 ， 即 用 于 构造 这 些 关 系 的 联结 
运算 符 在 做 儿 次 联结 之 后 就 停止 产生 新 的 元 组 了 。 

鉴于 上 面 的 讨论 ， 看 起 来 只 用 关系 代数 就 可 以 找 出 课程 的 间接 预备 课程 。 在 我 们 的 例子 中 ， 
我 们 所 要 做 的 就 是 检查 PREREQs 的 内 容 。 然 而 ， 在 经 过 更 为 仔细 的 考虑 之 后 ， 问 题 就 变 得 更 为 复 
杂 了 。 如 果 PREREQ 关 系 有 元 组 <CS220, CS214> 而 不 是 <CS305, CS214>， 那 将 会 怎么 样 呢 ? 在 这 
种 情况 下 ， 会 还 需要 进行 一 次 〈 或 多 次 远 代 ) 以 建立 CS632 和 CS113 之 间 的 间接 预备 课程 关 
系 ; Bhoc = cseaz AND Precrs = csi13 (PREREQs) 将 仍然 为 空 ， 但 是 acn = cseaz ANp Precrs = cs113 ( PREREQs ) 
不 为 空 。 

换 句 话说 ， 达 到 稳定 状态 表达 式 (7.16) 所 需要 重复 的 次 数 (随后 的 联结 没有 影响 ) 是 由 
数据 决定 的 ， 不 能 事先 预计 。 因 此 ， 对 于 像 Ocrs = csaz AND precrs ='c5113' (PREREQs) 这 样 的 表达 式 ， 
不 容易 判断 对 于 关系 PREREQ 的 所 有 合法 内 容 ，CS113 是 否 是 CS632 的 间接 预备 课程 。 事 实 上 ， 
[Aho and Ullman1979] 中 说 明了 关系 表达 式 不 能 提供 这 样 的 答案 ! 这 个 结果 说 明 , 像 关 系 代数 、 
关系 演算 和 SQL 这 样 的 关系 语言 的 表达 能 力 是 有 限 的 。 事 实 上 如 后 面 的 练习 7.14 所 示 ， 检 查 巴 
备课 程 具有 多 项 式 级 的 时 间 复 杂 度 ， 这 意味 着 SQL 不 能 够 表达 某 些 具有 多 项 式 级 时 间 复 杂 度 
的 查询 。 这 个 理论 结果 的 直接 实际 后 果 是 不 能 完全 用 SQL 来 编写 即使 很 简单 的 数据 库 应 用 程 
序 。 这 就 是 在 现实 世界 中 SQL 为 什么 不 用 在 提供 一 般 应 用 逻辑 的 宿主 语言 ( 像 C 或 Java) 之 内 
的 一 个 原因 。( 第 10 章 将 会 解释 这 是 怎么 做 的 。) 

等 式 (7.16) 被 称 为 是 循环 的 (recurrent)， 以 它 的 术语 表达 的 查询 称 为 是 递归 的 
(recursive ) 。 可 以 用 如 下 方法 计算 递归 查询 : 从 某 个 已 知 的 初始 值 (在 我 们 的 例子 中 就 是 
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PREREQ) 开始 重复 应 用 循环 等 式 ， 直 到 达到 一 个 稳定 的 状态 为 止 ， 即 直到 对 于 某 个 N 来 说 
PREREQw:i 等 于 PREREQw 为 止 。 换 名 话说 ， 关 于 预备 课程 的 查询 的 答案 就 是 循环 等 式 (7.16) 的 
稳定 状态 。 因 而 ，[Aho and Ullman 1979] 中 上 述 结果 的 另 一 个 解释 是 通常 不 能 用 关系 代数 表 

2. SQL 中 的 递归 

探讨 递归 查询 处 理 过 程 的 数据 库 研究 领域 称 为 演绎 数据 库 (deductive database ) ， 关 于 这 
个 主题 有 很 多 文献 (其 简介 见 [Ramakrishnan and Ullman 1995])。 最 终 ，SQL 标 准 组 认识 到 需 
要 处 理 递 归 查 询 ， 并 在 SQL:1999 中 增加 了 适当 的 扩展 。 我 们 下 一 步 将 讨论 这 些 扩展 。 

SQL:1999 不 使 用 (7.16) 那样 的 循环 等 式 来 定义 递归 查询 ， 因 为 这 些 等 式 与 判定 这 样 的 
查询 的 过 程 图 相对 应 。 与 最 初 的 观点 相 一 致 ，SQL:1999 是 声明 性 地 指定 要 检索 的 内 容 ， 而 不 
是 过 程 性 地 指定 如 何 检索 。 不 过 ， 可 以 从 语法 上 很 清楚 地 看 出 循环 等 式 和 SQL:1999 表 达 递 归 
查询 的 方法 之 间 的 联系 ， 特 别 是 对 于 递归 视图 。 例 如 ， 下 面 的 视图 指定 了 所 有 课程 - 预备 课 

CREATE RECURSIVE VIEW INDIRECTPREREQVIEW(Crs, PreCrs) AS 

SELECT * FROM PREREQ 

UNION 

SELECT P.Crs, I.PreCrs 

FROM PREREQ P, INDIRECTPREREQVIEW I 

WHERE P.PreCrs = I.Crs 

普通 视图 和 递归 视图 之 间 的 差异 是 递归 视图 的 定义 包含 了 两 个 独立 的 部 分 。 

“。 非 递归 子 查询 ”在 我 们 的 例子 中 ， 就 是 第 一 个 SELECT 语句 (在 UNION 运 算 符 之 上 )。 
它 不 能 包含 对 要 定义 的 视图 关系 的 引用 。 . 

*。 递 归 部 分 这 部 分 包含 了 第 二 个 子 查 询 (在 UNION 运 算 符 之 下 )。 和 非 递 轨 子 查询 不 同 ， 
它 引 用 了 关系 INDIRECTPREREQVIEW ， 即 正在 由 CREATE RECURSIVE VIEW 语句 定义 的 那个 
视图 。 

现在 应 该 清楚 ， 为 什么 这 样 的 视图 被 称 为 是 递归 的 : 它们 的 定义 看 起 来 是 循环 的 。 然 而 ， 

它们 的 内 容 有 很 好 的 定义 ， 并 根据 前 面 提 到 的 循环 等 式 可 以 清楚 地 理解 它们 。 
递归 视图 定义 中 非 递归 子 查询 的 目的 是 指定 用 于 循环 等 式 中 的 递归 关系 的 最 初 内 容 。 在 
这 个 例子 中 ， 这 个 子 查 询 说 明 INDIRECTPREREQVIEW 的 最 初 内 容 是 关系 PREREQ 的 内 容 。 我 们 把 
这 些 内 容 表 示 为 INDIRECTPREREQVIEWi。 

递归 部 分 指定 了 实际 的 循环 等 式 。 它 说 明 ， 为 了 得 到 INDIRECTPREREQVIEW 内 容 的 下 一 个 
近似 ， 必 须 假定 当前 的 近似 来 判定 这 个 查询 。 换 句 话 说 ，INDIRECTPREREQVIEWs 是 由 
INDIRECTPREREQVIEW, 和 下 面 查询 的 结果 做 并 集 而 计算 得 到 的 关系 。 


SELECT P.Crs, I.PreCrs 

FROM PREREQ P, INDIRECTPREREQVIEW, I 

WHERE P.PreCrs = I.Crs 

这 里 我 们 用 前 面 的 近似 INpIRECTPREREQVIEwW1 来 计算 INpIRECTPREREQVIEw? 的 值 。 这 个 循环 
等 式 的 稳定 状态 就 被 认为 是 这 个 递归 视图 的 含义 。 在 这 个 例子 中 ， 当 把 INDIRECTPREREQVIEW 
的 当前 内 容 和 最 初 的 PREREQ 关 系 做 联结 时 ， 不 再 产生 新 的 课程 - 预备 课程 对 时 ， 也 就 是 说 ， 
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当下 面 查询 的 结果 


SELECT P.Crs, I.PreCrs 
FROM PREREQ P, INDIRECTPREREQVIEW), I 
WHERE P.PreCrs = I.Crs 


包含 在 INDIRECTPREREQVIEww (N>0) 中 时 ， 就 达到 了 稳定 状态 。 
在 定义 了 递归 视图 之 后 ， 我 们 现在 就 可 以 用 通常 的 SELECT 语句 来 进行 查询 。 例 如 ， 为 了 
确定 CS113 是 否 是 CS632 的 间接 预备 课程 ， 我 们 可 以 编写 如 下 查询 : 


SELECT + | 
FROM INDIRECTPREREQVIEW I (7.17) 
WHERE I.PreCrs = 'CS113' AND I.Crs = 'CS632' | ` 


SQL:1999 也 提供 了 不 依赖 于 视图 的 递归 查询 语法 。 其 主体 思想 是 类 似 的 : 递归 查询 包含 
两 部 分 : 递归 关系 的 定义 和 对 这 个 关系 的 查询 。 第 一 部 分 的 语法 和 我 们 之 前 看 到 的 递归 视图 
定义 很 相近 ， 第 二 部 分 的 语法 就 是 普通 的 SQL ( 非 递归 的 ) 查询 。 例 如 ， 关 于 CS113 和 CS632 
之 间 的 间接 预备 课程 关系 的 查询 可 以 表达 如 下 : 


WITH RECURSIVE INDIRECTPREREQQUERY (Crs, PreCrs) AS 
( (SELECT * FROM PREREQ) 
UNION 
(SELECT P.Crs, I.PreCrs 
FROM PREREQ P, INDIRECTPREREQQUERY I 
WHERE P.PreCrs = I.Crs)) 
SELECT * 
FROM INDIRECTPREREQQUERY I 
WHERE I.PreCrs= 'CS113' AND I.Crs = 'CS632' 


注意 ， 这 个 查询 最 上 面 那 一 部 分 几乎 和 递归 视图 INDIRECTPREREQVIEW 的 定义 完全 相同 。 唯 一 
的 实质 性 区 别 是 ， 视 图 定义 是 保存 在 系统 目录 中 ， 以 后 在 其 他 查询 中 可 以 重用 ， 然 而 查询 
INDIRECTPREREQQUERY 的 定义 在 处 理 后 就 被 系统 丢弃 了 。 上 面 查 询 的 最 下 面 一 部 分 与 针对 视图 
INDIRECTPREREQVIEWH) # if] (7.17) 相对 应 。 

3. 互 递归 查询 

到 目前 为 止 ,递归 查询 考虑 的 传递 闭 包 还 没有 说 明 SQL:1999 中 递归 查询 功能 的 全 部 能 力 。 
下 面 考虑 一 个 较 复 杂 的 例子 ， 我 们 想 (完全 是 出 于 好 奇 ) 找 出 中 间 间 隔 奇 数 门 课程 的 预备 课 
程 。 我 们 可 以 通过 定义 关系 ODDPREREQ 来 表达 这 个 查询 ， 这 个 关系 与 另 一 个 关系 EVENPREREQ 
是 互 递归 的 (mutually recursive ， 即 每 个 关系 都 要 根据 另 一 个 关系 来 定义 )。 互 递归 可 以 借助 
于 WITH 语句 表达 如 下 : l 


WITH 
RECURSIVE ODDPREREQ (Crs, PreCrs) AS 
( (SELECT * FROM PREREQ) 
UNION 
(SELECT P.Crs, E.PreCrs 
FROM PREREQ P, EVENPREREQ E 
WHERE P.PreCrs = E.Crs)), 
RECURSIVE EVENPREREQ(Crs, PreCrs) AS 
(SELECT P.Crs, 0.PreCrs 
FROM PREREQ P, ODDPREREQ 0 
WHERE P.PreCrs = 0.Crs) 
SELECT * FROM ODDPREREQ 
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WITH 语句 在 这 个 查询 中 定义 了 两 个 临时 关系 OppPREREQ 和 EvENPREREQ。 第 一 个 关系 有 
非 递 归 子 查询 ， 它 指出 每 个 直接 预备 课程 也 是 一 门 奇数 预备 课程 。OppPREREQ 定 义 的 递归 部 
”分 指出 奇数 预备 课程 的 其 余部 分 是 通过 把 PREREQ 关 系 和 包含 所 有 偶数 预备 课程 的 关系 

EVENPREREQ 进 行 联结 而 得 到 的 。 后 一 个 关系 是 用 第 二 个 递归 查询 来 定义 的 。 这 个 查询 没有 非 
递归 的 部 分 ， 这 意味 着 EvENPREREQ 的 初始 值 是 空 关系 。EvENPREREQ 的 后 继 近 似 值 是 通过 把 
PREREQ 和 ODDPREREQ 进 行 联结 而 得 到 的 。 因 此 ，ODDPREREQ 和 EvENPREREQ 是 彼此 依赖 的 。 

4. 递归 使 用 的 限制 

SQL:1999 在 使 用 递归 时 有 许多 限制 ， 看 起 来 好 像 只 是 为 减少 销售 者 为 了 解释 深奥 的 特性 
需要 付出 的 代价 。 然 而 ， 一 些 限 制 是 由 于 技术 方面 的 考虑 和 保持 较 低 的 判定 查询 的 时 间 复 杂 
度 而 引起 的 。 这 个 类 别 中 最 重要 的 限制 与 否定 有 关 ， 它 是 用 关键 字 EXCEPT 和 NOT 来 表达 的 。 
为 了 进行 说 明 ， 假 设 我 们 想 找 出 所 有 责 正 的 夺 数 预备 课程 ， 即 那些 不 可 以 是 偶数 的 预备 课程 
(对 于 一 门 预备 课程 来 说 ， 它 可 以 既 为 奇数 也 可 以 为 偶数 ， 因 为 任何 一 对 课程 都 可 能 是 由 多 条 
预备 课程 链 连 接 的 ， 这 样 的 链 可 能 有 不 同 的 长 度 )。 我 们 可 以 试 着 用 以 下 方式 表达 这 个 查询 : 

WITH 

RECURSIVE ODDPREREQ(Crs, PreCrs) AS 
((SELECT * FROM PREREQ) 
UNION 
(SELECT P.Crs, E.PreCrs 
FROM PREREQ P, EVENPREREQ E 
WHERE P.PreCrs = E.Crs) (7.18) 
EXCEPT 
(SELECT * FROM EvENPREREQ)), 
RECURSIVE EVENPREREQ (Crs, PreCrs) AS 
(SELECT P.Crs, 0.PreCrs 
FROM PREREQ P, ODDPREREQ 0 


WHERE P.PreCrs = 0.Crs ) 
SELECT * FROM OppPREREQ 


这 个 查询 的 问题 与 在 OppPREREQ 定 义 的 递归 部 分 中 去 除 EvENPREREQ 关 系 有 关 。 就 像 我 们 
之 前 看 到 的 那样 ， 这 两 个 关系 是 彼此 依赖 的 。 所 以 ， 为 了 知道 哪些 元 组 在 ODDPREREQ 中 ， 我 
们 应 该 知道 哪些 元 组 不 在 EVENPREREQ 中 ， 而 这 就 需要 知道 哪些 元 组 在 EVENPREREQ 中 。 但 是 后 
者 又 需要 知道 哪些 元 组 在 ODDPREREQ 中 一 一 这 又 回 到 了 前 面 的 问题 。 

这 个 问题 通常 可 接受 的 解决 方案 (并且 是 用 在 SQL:1999 中 的 解决 方案 ) PERTE ( 像 
EXCEPT 和 NOT) 的 使 用 是 分 层 的 〈stratified )。 也 就 是 说 ， 如 果 关 系 P 的 定义 要 和 知道 关系 Q 
的 分 量 ， 那 么 Q 的 定义 一 定 不 能 依赖 于 P (或 它 的 分 量 )。 特 别 的 ，P 不 能 依赖 于 它 自己 的 分 量 。 
注意 (练习 7.15)， 非 递归 查询 中 否定 的 每 次 使 用 都 是 分 层 的 ， 所 以 SQL-92 中 不 必 有 这 个 限制 。 

查询 (7.18) 中 否定 的 使 用 不 是 分 层 的 ， 所 以 它 在 SQL:1999 中 是 不 合法 的 。 为 了 构造 检索 
所 有 真正 奇数 预备 课程 的 合法 查询 ， 我 们 必须 打破 ODDPREREQ 和 EVENPREREQ 定 义 中 的 互 递归 。 


WITH 
RECURSIVE OppPREREQ(Crs, PreCrs) AS 
( (SELECT * FROM PREREQ) 
UNION 
(SELECT P.Crs, E.PreCrs 
FROM PREREQ P, PREREQ P1, ODDPREREQ 0 
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WHERE P.PreCrs = P1.Crs AND P1.PreCrs = 0.Crs) 
EXCEPT 
(SELECT * FROM EVENPREREQ)) , 
RECURSIVE EVENPREREQ (Crs, PreCrs) AS 
( (SELECT P.Crs, P1.PreCrs 
FROM PREREQ P, PREREQ P1 
WHERE P.PreCrs = P1i.Crs 
UNION 
(SELECT P.Crs, E.PreCrs 
FROM PREREQ P, PREREQ P1, EVENPREREQ E 
WHERE P.PreCrs=P1.Crs AND Pi.PreCrs = E.Crs)) 
SELECT * FROM ODDPREREQ 
在 这 个 查询 中 ， 两 个 关系 OppPREREQ 和 EvENPREREQ 仍 然 是 递归 的 ， 但 是 不 再 相互 依赖 了 。 
ODpDpPREREQ 依 赖 于 EvENPREREQ 的 分 量 (因为 它 定 义 中 的 EXCEPT 子 句 )， 但 是 EvENPREREQ 并 不 


依赖 于 OppPREREQ。 因 此 ， 在 这 个 查询 中 否定 的 使 用 是 分 层 的 ， 这 个 查询 是 合法 的 。 


7.7 参考 书目 


[Codd 1972] 中 引入 了 元 组 关系 演算 ， 并 把 它 视 为 研究 关系 代数 作为 查询 语言 的 表达 能 力 的 理论 工 
Ro [Date 1992] 说 明了 TRC 如 何 有 效 地 用 作 构 造 复杂 SQL 查 询 的 中 间 语 言 。[Lacroix and Pirotte 1977] 中 
提出 域 关 系 演算 ， 并 把 它 作 为 数据 库 查询 的 语言 。[Zloof 1975] 中 引入 了 样 例 查询 。 用 两 种 演算 之 一 编 
写 的 域 独 立 查 询 和 关系 代数 的 等 价 证 明 要 归功 于 Codd， 在 [Ullman 1988] 中 可 以 找到 这 个 证 明 。 在 [Van 
Gelder and Topor 1991, Kifer 1988, Topor and Sonenberg 1988, Avron and Hirshfeld 1994] 等 文献 中 研究 了 
域 独 立 及 相关 的 问题 。 

传递 闭 包 查 询 不 能 用 关系 代数 表达 的 证 明 归 功 于 [Aho and Ullman 1979]。[Ullman 1988, Abiteboul 
et al. 1995] 中 广泛 地 讨论 了 演绎 数据 库 ，[Ramakrishnan et al. 1994, Sagonas et al. 1994, Vaghani et al. 
1994] 中 描述 了 许多 演绎 数据 库 系 统 的 研究 原型 。[Apt et al.1988] 中 引入 了 分 层 否 定 。 


7.8 练习 


7.1 a 解释 为 什么 元 组 关系 演算 被 称 为 声明 性 的 ， 而 关系 代数 被 称 为 过 程 性 的 。 

b. 解释 为 什么 尽管 SQL 是 声明 性 的 ， 但 是 关系 数据 库 管 理 系统 中 的 查询 优化 器 把 SQL 语句 翻译 成 
过 程 性 的 关系 代数 。 

7.2 用 语言 来 叙述 下 面 每 个 表达 式 的 含义 (这 里 Took 的 含义 很 明显 )。 比 如 ， 其 中 一 个 表达 式 的 答案 
是 “每 个 学 生 至 少 选 修 过 一 门 课程 。” 
a. JS © STUDENT (WC E Course Took(S, C)) 
b. VS € STUDENT (AC E Course TooK(S, C)) 
c. IC € Course (VS € STUDENT TooK(S, C)) 
d. VC € Course (4S € STUDENT TooK(S, C)) 

**7.3 证 明 元 组 关系 演算 中 的 任何 查询 在 域 关系 演算 中 都 有 等 价 的 查询 ， 反 之 亦 然 。 
*7.4 证 明 关系 代数 查询 是 域 独立 的 。 提 示 : 对 关系 代数 表达 式 的 结构 进行 归纳 。 

7.5 考虑 与 图 5-5 中 的 IsA 层 次 结构 对 应 的 关系 模式 。 假 设 这 个 模式 对 每 个 实体 都 有 一 个 关系 。( 参 考 
5.4 节 来 更 新 你 对 这 种 IsA 层 次 结构 到 关系 模型 的 翻译 的 认识 。) 用 元 组 关系 演算 和 域 关系 演算 来 
写 出 下 面 的 查询 : 
a. 找 出 计算 机 科学 专业 所 有 大 二 学 生 的 名 字 。 
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7.6 


77 


78 


*7.9 


b. 找 出 计算 机 科学 专业 所 有 学 生 的 名 字 。 

c. 找 出 满足 下 面 要 求 的 所 有 系 : 存在 某 些 技术 员 具 有 任何 其 他 技术 员 (本 系 或 外 系 ) 所 具有 的 每 
门 技术 。 

写 出 一 个 等 价 于 下 面 代 数 表达 式 的 域 关 系 演算 查询 : 

a.R-S 

b. R/S， 这 里 关系 R 有 属性 4、B，S 只 有 一 个 属性 B。 

利用 图 4-4 的 模式 ， 用 关系 代数 、 元 组 关系 演算 、 域 关系 演算 和 QBE 表 达 下 面 的 每 个 查询 。 

a. 找 出 由 属于 EE 系 或 者 MGT 系 的 教授 讲授 的 所 有 课程 。 

b. 列 出 在 1997 年 春季 和 1998 年 秋季 都 选修 过 课程 的 所 有 学 生 的 名 字 。 

c. 列 出 所 有 选修 过 至 少 两 个 来 自 不 同系 的 教授 讲授 的 课程 的 学 生 的 名 字 。 

d. 找 出 在 MGT 系 被 所 有 学 生 选 修 过 的 所 有 课程 。 

*e, 找 出 满足 下 面 要求 的 所 有 系 : 有 一 个 教授 教 过 那个 系 开设 的 所 有 课程 。 

比较 使 用 两 种 演算 、QBE 和 SQL 在 构造 上 面 查询 时 的 难 易 程 度 。 

如 果 你 有 一 份 Paradox 、Access 或 者 类 似 的 数据 库 管理 系统 的 拷贝 ， 用 附带 的 可 视 化 语言 来 设计 

上 面 的 查询 。 

用 TRC 和 DRC 来 写 出 练习 6.17 的 查询 。 


*7.10 用 TRC 和 DRC 来 写 出 练习 6.19 的 查询 。 
*7,11 用 TRC 和 DRC 来 写 出 练习 6.22 的 查询 。 


a. 找 出 对 代理 号 为 007 的 代理 所 负责 的 每 一 所 房屋 都 感 兴趣 的 所 有 客户 。 
b. 把 前 面 的 查询 当 作 视图 ， 检 索 形 如 <feature, customer> 的 一 组 元 组 ， 这 里 结果 中 的 每 个 元 组 说 
明了 一 个 特性 和 要 求 这 一 特性 的 一 个 客户 ， 而 且 : 
*。 只 考虑 对 代理 007 负 责 的 每 一 个 房屋 都 感 兴趣 的 客户 。 
“对 “feature” 感 兴趣 的 客户 的 数目 要 大 于 2。( 如果 这 个 数目 小 于 等 于 2， 那 么 就 不 把 相应 的 
元 组 <feature, customer> 加 进 结果 。) 
不 能 方便 地 用 TRC 或 者 DRC 来 表达 这 一 部 分 查询 ， 因 为 它们 缺少 计数 操作 符 。 不 过 ， 完 成 上 述 
工作 仍然 是 可 能 的 ， 而 且 也 不 难 。 
用 TRC 和 DRC 写 出 SQL 查询 (6.8) 和 查询 (6.9). 
阐述 SQL 操作 符 EXISTS 和 TRC 量 词 3 之 间 的 逻辑 关系 。 具 体 来 说 ， 请 用 TRC 来 表达 查询 (6.23). 


*7.14 说 明 计 算 PREREQ 的 传递 闭 包 的 迭代 过 程 在 有 限 次 数 的 步 又 之 后 会 中 止 。 假 设 略 微 修 改 这 个 过 程 
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以 避免 元 余 的 计算 ， 那 么 说 明 这 个 过 程 可 以 在 多 项 式 级 的 时 间 里 计算 传递 闭 包 。 

说 明 在 SQL-92 查 询 中 ， 否 定 的 每 次 使 用 都 是 分 层 的 。 

考虑 列 出 城市 间 所 有 直 飞 航线 的 关系 DIRECTFLIGHT(StartCity， DestinationCity)。 使 用 SQL:1999 的 
递归 功能 来 编写 一 个 查询 ， 它 找 出 所 有 的 配对 <cipu city,>， 要 求 从 city1 到 city, 有 一 个 间接 的 航 
线 ， 并 且 在 二 者 之 间 至 少 有 两 站 。 

使 用 SQL:1999 的 递归 功能 来 表达 所 谓 的 “同辈 ”的 查询 : 给 定 PARENT 关 系 ， 找 出 所 有 的 人 员 配 
对 ， 每 一 对 人 都 有 相同 的 祖先 ， 并 且 从 她 到 这 一 祖先 隔 了 相同 的 代数 。( 例 如 ， 一 个 小 孩 相对 她 
的 父亲 来 说 隔 了 一 代 ， 相 对 她 的 祖父 亲 来 说 隔 了 两 代 。) 

考虑 下 面 的 材料 单 问题 :数据 库 有 一 个 关系 SUBPART(Part, Subpart, Quantity)， 它 指出 了 每 个 零 
件 直 接 需 要 的 子 零 件 以 及 需要 的 数量 。 例 如 ， SUBPART(mounting_assembly, screw, 4) 表 示 安 装 物 
包含 了 4 个 螺丝 钉 。 为 了 简单 起 见 ， 假 设 没有 子 零件 的 零件 (原子 零件 ) 具有 NULL 作 为 唯一 的 
子 零件 (例如 ，SUBPART(screw, NULL, 0))。 写 出 一 个 递归 查询 来 列 出 所 有 的 零件 ， 并 和 且 对 于 每 
个 零件 来 说 ， 给 出 它 拥 有 的 原始 子 零件 的 数目 。 
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E-R 方 法 可 以 很 好 地 控制 现实 世界 建 模 的 复杂 性 。 然 而 ， 它 只 是 一 组 指导 原则 ， 掌 握 这 些 
原则 需要 有 相当 的 专业 知识 和 直觉 ; 而且， 对 于 相同 的 情况 它 可 以 产生 不 同 的 设计 方案 。 但 
是 ，E-R 方 法 并 不 包括 一 些 评价 标准 或 工具 ， 来 帮助 我 们 选择 设计 方案 和 对 方案 进行 改进 。 在 
本 章 中 ， 我 们 将 介绍 关系 规范 化 理论 (relational normalization theory)， 它 包括 一 些 概念 和 算 
法 。 这 些 概念 和 算法 可 以 帮助 我 们 对 通过 E-R 方 法 得 到 的 设计 进行 评价 与 改进 。 

在 规范 化 理论 中 使 用 的 主要 工具 是 函数 依赖 (functional dependency) 的 概念 (以 及 更 低 
程度 的 联结 依赖 (join dependency) 的 概念 )。 函 数 依赖 是 对 E-R 方 法 中 键 依赖 的 一 种 推广 ， 而 
联结 依赖 在 E-R 方 法 中 没有 相应 的 方法 。 设 计 者 使 用 这 两 种 依赖 来 发 现在 E-R 设 计 中 把 两 个 不 
同 实体 类 型 的 属性 放 到 同一 个 关系 模式 中 这 种 不 正常 的 情况 。 这 些 情况 我 们 用 范式 (normal 
form) 来 刻画 ， 它 起 源 于 规范 化 理论 这 个 术语 。 规 范 化 理论 通过 使 用 分 解 (decomposition) 
使 关系 成 为 合适 的 范式 ; 分 解 是 指 分 离 那些 把 不 相关 实体 类 型 混在 一 起 的 模式 。 由 于 分 解 在 
关系 设计 扮演 着 中 心 角 色 ， 因 此 我 们 将 要 讨论 的 技术 有 时 也 称 为 关系 分 解 理论 (relational 


decomposition theory ) 。 


8.1 元 余 所 带 来 的 问题 


示例 是 理解 基于 E-R 方 法 进行 关系 设计 所 具有 的 潜在 问题 的 最 好 方法 。 考 虑 (5.1) 的 语 
“J: CREATE TABLE PERSON。 这 个 关系 模式 是 通过 直接 转换 E-R 图 (图 5-1) 而 得 来 的 。 对 于 这 
个 转换 ， 我 们 首先 可 以 发 现 的 错误 是 : SSN 并 不 是 PERSON 关 系 的 键 ， 而 (SSN ,Hobby) 的 组 合 
才 是 键 。 换 旬 话 说 ， 属 性 SSN 并 不 能 唯一 决定 PERSON 关 系 中 的 元 组 ， 尽 管 它 确 实 唯 一 决定 了 
PERSON 实 体 集中 的 实体 。 这 不 仅 与 我 们 的 直觉 相反 ， 而 且 它 对 PERSON 关 系 模式 的 实例 也 会 产 
生 一 些 不 良 的 影响 。 

为 说 明 这 一 点 ， 我 们 仔细 看 一 下 图 5-2 中 的 关系 实例 。 注 意 ，John Doe 和 Mary Doe 均 由 
多 个 元 组 表示 ， 并 且 他 们 的 地 址 ， 姓 名 和 Id 也 多 次 出 现 。 相 同 信息 的 宛 余 存储 问题 在 这 里 表 
现 得 很 明显 。 然 而 ， 空 间 的 浪费 并 不 是 关键 问题 。 真 正 的 问题 是 ， 当 对 数据 库 进 行 更 新 时 ， 
我 们 必须 保持 相同 数据 的 元 余 拷 贝 之 间 的 一 致 性 ， 并 且 能 使 更 新 有 效 进行 。 特 别 地 ， 我 们 应 


该 考虑 如 下 问题 : | 
更 新 异常 ”如 果 John Doe 搬 到 1 Hill Top Dr, 更 新 图 5-2 中 的 关系 时 还 必须 修改 描述 John 
Doe 实 体 的 两 个 元 组 的 地 址 。 . 


揪 入 异常 ”假如 我 们 决定 把 Homer Simpson 添 加 到 PERsoN 关 系 中 去 ， 但 在 Homer 的 信息 表 
中 并 没有 说 明 他 的 任何 爱好 。 解 决 此 问题 的 一 个 方法 是 加 入 元 组 <023456789, Homer Simpson, 
Fox 5 TV, NULL>， 即 将 缺失 的 字段 用 NULL 填 充 。 然 而 ，Hobby 字 段 是 主键 的 一 部 分 ， 大 部 
分 DBMS 不 允许 主键 出 现 空 值 。 为 什么 ? 一 方面 ，DBMS 通 常 在 主键 上 维护 一 个 索引 ， 而 它 并 





不 清楚 索引 应 该 如 何 引 用 空 值 。 假 定 这 个 问题 可 以 解决 ， 有 一 个 请 求 要 求 插入 <023456789， 
Homer Simpson, Fox 5 TV, acting>。 这 个 新 的 元 组 是 应 该 被 添加 进去 ， 还 是 应 该 替换 现 有 的 元 
组 <023456789, Homer Simpson, Fox 5 TV, NULL>? 有 人 很 可 能 选择 替换 它 ， 因 为 人 们 通常 并 
不 认为 爱好 是 一 个 人 特征 的 一 部 分 。 然 而 ， 计 算 机 如 何 知道 主键 为 <111111111,NULL> 和 
<111111111,acting> 的 元 组 指 同一 个 实体 ? (关于 哪个 元 组 来 自 哪个 实体 的 信息 在 转换 中 已 经 丢 
失 ! ) 宛 余 是 产生 这 种 不 确定 性 的 根源 : 如 果 Homer 最 多 只 被 一 个 元 组 描述 ， 那 么 只 有 表演 这 
门 课程 是 符合 要 求 的 。 

删除 异常 ”假设 Homer Simpson 不 再 对 表演 感 兴趣 。 我 们 如 何 删除 这 个 业余 爱好 ? 当然 ， 
我 们 可 以 删除 与 Homer 表 演 兴 趣 相关 的 元 组 。 然 而 ， 由 于 只 有 一 个 元 组 引用 Homer (参见 图 
5-2)， 这 会 把 关于 Homer 的 14 和 地 址 这 些 有 用 的 信息 也 丢掉 。 为 避免 这 种 信息 的 丢失 ， 我 们 可 
以 把 acting 赫 换 为 NULL。 这 又 会 引起 主键 属性 为 空 的 问题 。 在 这 里 ， 元 余 又 一 次 成 为 元 办 。 
如 果 只 用 一 个 元 组 就 可 以 描述 Homer， 那 么 属性 Hobby 将 不 会 是 键 的 一 部 分 。 

为 方便 起 见 ， 我 们 有 时 用 术语 “更 新 异常 ”来 指 代 上 面 提 到 的 所 有 异常 类 型 。 


8.2 分 解 


元 余 所 引起 的 问题 (浪费 空间 和 异常 ) 可 以 使 用 如 下 的 技术 进行 修正 。 不 使 用 单个 关系 
来 描述 所 有 关于 某 个 人 的 信息 ， 而 用 两 个 单独 的 关系 模式 。 

PERSON! (SSN, Name, Address) 

Hossy (SSN, Hobby) (8.1) 


对 图 5-2 中 的 关系 进行 投影 可 以 得 到 图 8-1 所 示 的 模式 。 这 个 新 的 设计 有 如 下 性 质 : 


sa r a 


111111111 John Doe 123 Main St. 
555666777 Mary Doe 7 Lake Dr. 
987654321 Bart Simpson Fox 5 TV — 


111111111 stamps 
111111111 hiking 












111111111 | coins 

585666777 hiking 
555666777 skating 
987654321 acting 












a) PERSON] 
f b) HOBBY 
图 8-1 . 图 5-2 中 关系 PERSON 的 分 解 ' 


1) 尽管 在 所 有 人 都 有 业余 爱好 的 情况 下 ， 关系 PERsoN 在 缺 关 业余 爱好 的 情况 下 无 法 檀 术 
个 人 信息 ， 但 它 是 PERSON1 和 HoBBY 的 自然 联结 。 这 个 性 质 并 不 是 我 们 例子 的 制品 ， 即 在 某 种 
常理 假设 下 《〈 即 SSN 唯 一 决定 一 个 人 的 姓名 和 地 址 )， 对 图 5-2 中 的 模式 ， 任 何 关 系 r 都 等 同 于 r 
在 (8.1) 中 两 个 关系 模式 投影 的 自然 联结 。 这 个 性 质 称 为 无 损 性 (losslessness ) ， 它 将 会 在 
8.6.1 节 进行 讨论 。 这 意味 着 我 们 的 分 解 保留 了 代表 PERSON 关 系 的 原始 信息 。 

2) 在 图 5-2 中 原始 关系 的 元 余 和 更 新 异常 已 经 消除 。 存 储 次 数 多 于 一 次 的 唯一 项 是 SSN， 

是 类 型 PERsoN 的 实体 的 标识 符 。 因 此 ， 现 在 对 地 址 、 姓 名 、 业 余 爱 好 的 改变 只 会 影响 一 个 
元 组 。 同 样 ， 把 Bart Simpson 的 爱好 从 数据 库 删 除 并 不 会 删除 他 的 地 址 信息 ， 也 不 要 求 我 们 对 
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空 值 产生 依赖 。 由 于 我 们 可 以 单独 地 添加 和 信和 业余 爱好 ， 因 此 插入 异常 也 消除 了 。 

注意 ， 新 的 设计 同样 有 一 定 的 元 余 ， 并 且 我 们 在 茶 些 情况 下 可 能 还 要 使 用 空 值 。 首 先 ， 
由 于 我 们 使 用 SSN 作 为 元 组 的 标识 符 ， 每 个 SSN 可 以 出 现 多 次 ， 而 且 所 有 这 些 出 现 必须 在 数据 
库 中 保持 一 致 。 因 此 一 致 性 维护 问题 并 没有 完全 消除 。 然 而 ， 如 果 标 识 符 是 非 动态 的 (比如 
SSN 不 会 经 常 改变 )， 那 么 一 致 性 的 维护 会 简单 很 多 。 其 次 ， 考 虚 某 种 情况 : 添加 一 个 人 到 关 
系 PERSON1 但 却 不 知道 他 的 地 址 。 很 明显 ， 即 使 对 新 的 设计 ， 我 们 不 得 不 为 相应 的 元 组 在 字段 
Address 中 插入 NULL。 然 而 ，Address 并 不 是 主键 的 一 部 分 ， 因 此 这 里 使 用 NULL 不 会 有 太 坏 
的 影响 〈 使 用 Address 属 性 来 联结 PERsoN1 仍 会 有 困难 )。 

并 不 是 所 有 的 分 解 都 是 等 价 的 ， 理 解 这 一 点 很 重要 。 事 实 上 ， 大 部 分 分 解 尽管 在 消除 元 
余 方 面 做 的 很 好 ， 但 其 并 没有 什么 意义 。 分 解 

Ssn (SSN) 

NAME (Name) 


ADDRESS (Address) 
HoBBY (Hobby) 


是 消除 最 终 元 余 的 分 解 。 对 图 5-2 的 关系 的 投影 会 产生 一 个 每 个 值 只 出 现 一 次 的 数据 库 ， 如 图 
8-2 所 示 。 但 是 ， 这 个 新 的 数据 库 几乎 没有 任何 有 用 信息 ; 我 们 不 可 能 再 知道 John Doe 住 在 哪 
里 , 或 者 谁 把 集邮 作为 业余 爱好 。 这 种 情况 与 图 8-1 中 的 分 解 形成 鲜明 对 比 。 对 图 8-1， 通 过 自 
然 联结 我 们 能 够 恢复 原始 关系 所 表示 的 信息 。 


(8.2) 


. stamps 


123 Main St. | hiking 
7 Lake Dr. coins 


111111111 John Doe > 


555666777 Mary Doe 
987654321 Bart Simpson 





“Fox 5 TV skating 





acting 
图 8-2 最 终 的 分 解 


精 化 模式 的 需求 

从 实体 类 型 PERSON 到 关系 模型 的 转换 说 明 不 能 只 依靠 E-R 方 法 来 设计 数据 库 模式 。 而 且 ， 
例子 PERSON 所 暴露 的 问题 十 分 常见 。 考 虑 图 5-10 中 的 联系 HASACCOUNT。 从 HASACCOUNT 到 关 
系 模型 的 一 个 典型 转换 为 


CREATE TABLE HasAccount ( 

AccountNumber INTEGER NOT NULL, 

ClientId CHAR (20), 

Officeld INTEGER, (8.3) 
PRIMARY KEY (ClientId, OfficeId), 

FOREIGN KEY (OfficeId) REFERENCES OFFICE 

Lee eee eee ) - 


回忆 一 下 ， 一 个 客户 在 一 个 办 事 处 最 多 只 有 一 个 账户 ， 因 此 (ClientId, OfficeId) 是 一 个 键 。 
同样 ， 一 个 账户 只 能 分 配 到 一 个 办 事 处 。 仔 细 分 析 一 下 可 以 发 现 ， 这 个 要 求 会 导致 在 PERSON 
例子 中 出 现 的 同样 问题 。 例 如 ， 对 于 记录 一 个 特定 的 账户 由 特定 的 办 事 处 管理 这 一 事实 的 元 
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组 ， 在 没有 记录 客户 信息 的 情况 下 (由 于 ClientId 是 主键 的 一 部 分 )， 它 是 不 能 被 添加 进去 的 ， 
这 就 是 插入 异常 。 由 于 这 种 特定 应 用 的 特殊 性 ， 这 种 情况 (和 删除 异常 ) 也许 并 不 是 一 个 严 
重 的 问题 ; 但 是 更 新 异常 会 导致 维护 问题 。 把 一 个 账户 从 一 个 办 事 处 移 到 另 一 个 办 事 处 需要 
改变 对 应 于 那个 账户 的 每 个 元 组 中 的 OfficeId。 如 果 这 个 账户 有 多 个 客户 ， 那 么 这 可 能 就 会 有 
问题 。 

我 们 会 在 本 章 的 后 面 再 介绍 这 个 例子 ， 因 为 HASAccoUNT 有 一 些 PERSON 例 子 所 没有 的 有 趣 
的 性 质 。 比 如 ， 尽 管 我 们 期 望 对 HAsAccouNT 进 行 分 解 ， 但 这 会 导致 额外 的 在 PERSON 的 分 解 中 
没有 出 现 的 维护 开销 。 

上 述 讨论 产生 两 个 要 点 : 1) 作为 对 E-R 方 法 的 一 个 补充 ， 关 系 模式 的 分 解 在 消除 元 余 的 
问题 上 是 一 个 有 用 的 工具 ; 2) 选择 正确 分 解 的 标准 并 不 是 显而易见 的 ， 特 别 是 在 处 理 包含 很 
多 属性 的 模式 时 更 是 如 此 。 由 于 这 些 原 因 ，8.3 ~ 8.6 节 的 目的 就 是 研究 相关 的 技术 与 标准 ， 以 
识别 需要 分 解 的 关系 模式 ; 以 及 理解 在 分 解 中 不 丢失 信息 的 含义 。 

在 分 解 理论 的 发 展 过 程 中 ， 主 要 的 工具 是 函数 依赖 (functional dependency ) ， 它 是 键 约 
东 思 想 的 一 个 扩展 。 函 数 依赖 用 于 定义 范式 (normal form )， 即 在 更 新 密集 的 事务 系统 中 对 关 
系 模式 的 一 组 要 求 。 这 就 是 分 解 理论 经 常 被 称 为 规范 化 理论 (normalization theory) 的 原因 。 
8.5 ~ 8.9 节 将 展示 在 规范 化 过 程 中 所 用 的 算法 。 


8.3 函数 依赖 


在 本 章 剩 下 的 部 分 ， 我 们 使 用 在 关系 规范 化 理论 中 常用 的 特定 符号 来 表示 属性 ， 这 些 属 
性 如 下 所 示 : 从 字母 表 开始 的 大 写字 母 (ABCD) 代表 单个 属性 ; 在 字母 表 中 从 中 间 到 最 后 


如 ABCD， 代 表 相 应 属性 的 集合 ({4,8,C,D}) ; 带 上 划 线 的 字母 组 成 的 字符 串 ， 如 ( XY 了 Z )， 
代表 这 些 集 合 的 并 ( XU 了 了 U Z)。 我 们 应 该 熟悉 这 些 符 号 ， 它 提供 了 一 种 简洁 的 语言 ， 在 实 
例 与 定义 中 使 用 这 些 符号 会 非常 方便 。 

对 关系 模式 R 的 函数 依赖 (FD) 是 形 如 对 一 了 的 一 种 约束 ， 下 和 了 是 R 中 的 属性 集 。 如 
果 r 是 R 的 关系 实例 ， 并 且 满 足 如 下 条 件 ， 那 么 认为 它 满足 函数 依赖 : 


对 r 中 每 一 对 元 组 f 和 5s， 如 果 t 和 s 在 玉 属 性 集 上 的 值 一 致 ， 那 么 t 和 5s 在 了 属性 集 上 的 值 
也 一 致 。 


换 句 话说， 在 r 中 不 应 该 有 一 对 元 组 ， 它 们 在 鲜 属 性 集 上 的 值 一 致 ， 但 对 了 中 某 些 属性 却 有 不 
同 的 值 。 

注意 ,第 4 章 介绍 的 键 约束 是 FD 的 一 种 特殊 情况 。 假 定 key( 天) 是 关系 模式 R 中 的 键 约束 ， 
r 是 R 的 关系 实例 。 根 据 定义 ， 当 且 仅 当 没 有 一 对 不 同 的 元 组 ，(1, s E r)， 使 得 :fs 在 key( K) 
上 的 每 一 个 属性 上 有 相同 的 值 ， 那 么 r 满 足 key( 下)。 因 此 ， 键 约束 等 同 于 FD K-R, KE 
键 约束 中 属性 的 集合 ， 下 是 模式 R 的 所 有 属性 的 集合 。 

请 记 住 ， 函 数 依赖 与 关系 模式 相关 联 ， 而 当 我 们 考虑 是 否 满足 一 个 函数 依赖 时 ， 我 们 必 
须 考虑 那些 模式 的 关系 实例 。 这 是 因为 FD 是 模式 上 的 完整 性 约束 (类似 于 键 约束 )， 即 限制 
满足 给 定 FD 情 况 下 允许 的 关系 实例 的 集合 。 因 此 ， 给 定 一 个 模式 R=( R;Constraints), REE 
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性 的 集合 ，Constraints 是 函数 依赖 的 集合 ， 我 们 要 寻找 下 的 所 有 关系 实例 的 集合 ， 它 们 满足 
Constraints 中 的 每 个 函数 依赖 。 这 样 的 关系 实例 称 为 R 的 合法 实例 (legal instance), 
函数 依赖 与 更 新 异常 
存在 于 关系 模式 中 的 特定 的 函数 依赖 会 导致 相应 的 关系 实例 的 元 余 。 考 虑 8.1 节 与 8.3 节 讨 
论 的 两 个 例子 : 模式 PERsoN 和 HASAccouNT。 每 个 模式 有 一 个 主键 ， 这 些 主 键 分 别 在 (5.1) 
45 (8.3) 相应 的 CREATE TABLE 命 令 中 定义 。 相 应 地 ， 有 如 下 的 函数 依赖 : 


PERSON: SSN,Hobby 一 SSN,Name,Address,Hobby 
HasAccountT: ClientId,0fficeId 一 AccountNumber, (8.4) 
ClientId,OfficelId 


然而 ， 这 些 并 不 是 最 初 的 规格 说 明 所 歼 含 的 仅 有 的 国 数 依赖 。 例 如 ， 在 图 5-1 的 E-R 图 中 ， 
Name 和 Address 被 定义 为 单 值 属性 。 这 表明 ， 一 个 PERSON 实 体 (由 它 的 SSN 属 性 标识 ) 最 多 
只 能 有 一 个 名 字 和 一 个 地 址 。 类 似 地 ，PSSC (5.5 节 所 讨论 的 经 纪 人 公司 ) 的 业务 规则 要 求 
每 个 账户 只 能 确切 地 分 配 到 一 个 办 事 处 ， 这 意味 着 对 于 相应 的 关系 模式 ， 如 下 的 函数 依赖 同 
样 成 立 : 

PERSON : SSN — Name, Address (8.5) 

HASACCOUNT: AccountNumber 一 Officeld 


很 容易 看 出 (8.4) 中 依赖 的 句法 结构 对 应 于 我 们 在 相应 关系 中 所 确定 的 更 新 异常 。 比 如 ， 
在 PERSON 中 的 问题 是 对 任何 给 定 的 SSN， 我 们 无 法 单独 改变 属性 Name 和 Address 的 值 ， 而 不 
考虑 相应 的 个 人 是 否 有 业余 爱好 ， 即 如 果 某 个 人 有 多 个 爱好 ， 那 么 这 个 改变 将 在 多 行 发 生 。 
同样 ， 对 于 HASAccouNT， 我 们 无 法 改变 OfficeId ( 即 把 一 个 账户 转 到 另 一 个 办 事 处 ) 的 值 而 
不 去 考虑 与 此 账户 关联 的 所 有 客户 。 由 于 若干 个 客户 共享 同一 个 账户 ， 在 HASAccouNT 中 可 以 
有 多 行 引 用 同一 个 账户 ; 因此 ，OfficeId 所 在 的 多 行 必须 同时 改变 。 

注意 ， 对 上 述 两 个 例子 ， 涉 及 更 新 异常 的 属性 均 出 现在 函数 依赖 的 左 侧 。 我 们 可 以 看 到 ， 
更 新 异常 与 特定 类 型 的 函数 依赖 有 联系 。 那 么 什么 样 的 依赖 是 不 好 的 ?请 注意 (8.4) 与 (8.5) 中 
依赖 的 主要 区 别 : 前 者 说 明 相 应 关系 的 键 约束 ， 而 后 者 不 是 。 

然而 ， 只 是 知道 哪些 依赖 会 导致 异常 还 不 够 ， 我 们 必须 能 采取 某 些 方式 解决 这 些 问 题 。 我 
们 不 能 只 是 抛弃 不 好 的 函数 依赖 ， 因 为 它们 是 数据 库 所 建 模 的 业务 规则 的 一 部 分 。 它 们 是 需 
求 文档 的 一 部 分 ， 在 没有 征 得 顾客 同意 的 情况 下 不 能 改变 。 另 一 方面 ， 我 们 看 到 模式 分 解 是 
一 个 有 用 的 工具 。 尽 管 分 解 不 能 抛弃 函数 依赖 ， 但 它 可 以 使 依赖 工作 正常 。 比 如 ，(8.1) 中 的 
分 解 所 产生 的 模式 会 把 不 良 的 函数 依赖 SSN 一 Name，Address 变 为 一 个 行为 良好 的 键 约束 。 


8.4 函数 依赖 的 性 质 

在 进一步 讨论 之 前 ， 我 们 应 该 掌握 一 些 函 数 依赖 的 数学 性 质 和 检测 它们 的 算法 。 由 于 这 
些 性 质 和 算法 依赖 于 8.3 节 开始 所 介绍 的 符号 惯例 ， 所 以 我 们 重新 回顾 一 下 这 些 企 例 。 

我 们 要 研究 的 函数 依赖 的 性 质 基 于 冀 涵 (entailment)。 考 虑 属性 集中， 下 的 函数 依赖 的 
集合 为 F，R 的 另 一 个 函数 依赖 为 [。 如 果 对 属性 集 下 每 个 关系 r 有 如 下 性 质 ， 则 称 F 草 涵 f 
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给 定 一 个 函数 依赖 的 集合 F，F 的 闭 包 (closure) F' 是 所 有 被 F 蕴 涵 的 函数 依赖 的 集合 。 很 
明显 ， 启 包含 F 为 子 集 ® 。 

如 果 F 和 G 是 函数 依赖 的 集合 ， 如 果 F 蕴 涵 G 中 每 个 单独 的 函数 依赖 ， 那 么 我 们 说 F 蕴 涵 G。 
UR FSG AGH, 则 和 G 称 为 等 价 。 

我 们 现在 介绍 几 个 强 涵 中 简单 但 重要 的 性 质 。 

1. 8 A (Reflexivity ) 

无 论 在 什么 情况 下 ， 每 一 个 关系 均 满 足 某 些 函数 依赖 。 这 些 依赖 的 形式 为 忒 ~ Y, K 
中 了 上 SEX ， 它 们 称 为 平凡 (trivial) 函数 依赖 。 

。 自 反 性 说 明 , 如 果 Y 了 CX ， 那 么 X~ 了 。 

为 说 明 平 几 函 数 依赖 为 什么 总 被 满足 ， 考 虑 关系 r， 它 的 属性 集 包括 了 中 的 所 有 属性 。 
Rir, s E r 为 在 了 上 一 致 的 元 组 .。 但是， 由 于 了 C 匀 ， 这 意味 着 :和 s 也 在 了 上 一 致 。 因 此 ， 
rie X- Y. 

RRETA JL eae A AK. FES RARE PIL, Ae 
FAAARA PIR, FES OE LB 

2. 387° (Augmentation) 

GE ABR X Yman. RAAKUYUZ. BAK - 
涵义 Z -> 了 YZ。 换 旬 话说 ， 对 玉 中 每 个 关系 r 满 足 X- Y 则 一 定 也 满足 函数 依赖 XZ -> 

。 增 广 性 说 明 ， 如果 X- Y, AXZ. 

下 面 来 证 明 这 个 性 质 。 如 果 t,s Er 在 X 2 的 每 个 属性 上 均一 致 ,那么 它们 在 上 也 一 致 。 
由 于 r 满 足 匀 一 了 了， 所 以 t 和 s 也 必须 在 了 上 一 致 。 由 于 我 们 已 经 假定 它们 在 更 大 的 属性 集 XZ 
上 一 致 ， 那 么 它们 在 Z 上 也 一 致 。 因 此 ， 如 果 :，s 在 匀 Z 的 每 个 属性 上 均一 致 ， 那 么 它们 
在 YZ 上 也 一 致 。 由 于 这 是 我 们 在 r 中 任意 选择 的 一 对 元 组 ， 因 此 可 以 表明 r 满 足 XYZ- 了 YZ。 

3. 传递 性 (Transitivity ) . 

HARE X- Y, Y- Zam RRR X- 

。 传 递 性 说 明 ， 如 果 X - YAY SZ, PAY HZ 

这 个 性 质 可 以 用 与 前 面 类 似 的 方法 进行 证 明 ( 见 练习 )。 

这 三 个 函数 依赖 的 性 质 称 为 Armstrong 公 理 9， 它 们 主要 用 于 证 明 各 种 数据 库 设 计算 法 的 
正确 性 。 然 而 ， 他 们 也 同样 是 供 (真正 的 ) 数据 库 设 计 者 使 用 的 有 力 工 具 ， 因 为 它们 能 帮助 
人 们 快速 的 找到 关系 模式 中 有 问题 的 函数 依赖 。 我 们 现在 看 一 下 如 何 用 Armstrong 公 理 来 推导 

4. 函数 依赖 的 并 

FE KAY, BBE X- YOK > 过 ,那么 它 也 一 定 满 足 豆 ~ YZ. WEMA, R 
们 可 以 使 用 Armstrong 公 理 定义 的 简单 的 语法 操纵 从 志 ~ YR X > ZHESU XK YZ. xý 
操纵 很 容易 在 计算 机 中 进行 编程 ， 不 像 我 们 在 建立 公理 本 身 时 基于 元 组 进行 考虑 。 下 面 是 推 
理 过 程 : 


Y 4 
YZ. 


但 ”如 果 fE 五 ， 那 么 满足 F 中 每 个 函数 依赖 的 关系 很 明显 满足 fj。 因 此 ， 根 据 蕴涵 的 定义 ,， fe. 
O 严格 来 说 ， 它 们 是 推理 规则 ， 因 为 它们 从 旧 规 则 中 产生 新 规则 。 只 有 自 反 性 可 以 视 为 公理 
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a) X—Y 已 知 条 件 
b X-Z 已 知 条 件 
c) X- FX 把 X Blah PW: Armstrong 增 广 规则 
d YX-YZ 把 了 加 到 b 的 两 边 : Armstrong 增 广 规则 
9 -了 7 应 用 于 c 和 d 的 Armstrong 传 递 规则 

5. 函数 依赖 的 分 解 


同样 我 们 可 以 证 明 如 下 规则 : 每 个 关系 满足 各 ~ 了 二 ,那么 一 定 满足 函数 依赖 X - Y 
AIX > 过。 可 以 通过 下 列 简单 的 步骤 进行 证 明 : 

a) X- YZ 条 件 

b) Y Z- Y 根据 Armstrong 自 反 性 规则 ， YCYZ 

c) X- Y 根据 a 与 b 的 传递 性 

同样 可 推出 X- Z. 

Armstrong 公 理 明显 是 正确 (sound) 的 。 正 确 是 指 根 据 公理 推出 的 任何 表达 式 - Y 
实 是 函数 依赖 。 正 确 性 来 源 于 如 下 事实 : 我 们 已 经 证 明 这 些 推理 规则 对 每 个 关系 都 有 效 。 然 
而 ， 在 它们 是 完整 的 (complete) 这 方面 就 不 太 明 显 ， 即 如 果 一 个 函数 依赖 集 F 荀 涵 另 一 个 函数 
依赖 /， 那 么 在 只 依靠 Armstrong 公 理 的 情况 下 ， 利 用 类 似 于 上 面 的 步骤 顺序 ， 可 以 从 F 推 出/ 
这 里 我 们 不 证 明 这 个 事实 ， 但 在 [Ullman 1998] 中 可 以 找到 相应 的 证 明 。Armstrong 公 理 的 正确 
性 和 完整 性 并 不 只 是 理论 上 有 用 ， 这 个 结论 的 实际 价值 也 相当 高 ， 因为 它 保 证 函数 依赖 的 绚 
mm ( 即 是 否 有 FE F') 可 以 用 计算 机 程序 来 进行 验证 。 我 们 下 面 就 介绍 这 样 一 个 算法 。 

验证 函数 依赖 集 F 绚 洱 函 数 依赖 /的 一 个 直接 方法 是 指导 计算 机 对 匹 应 用 Armstrong 公 理 对 
下 进行 各 种 可 能 情况 的 尝试 。 由 于 F 和 /中 属性 集 的 个 数 是 有 限 的 ， 所 以 这 个 推导 过 程 不 会 永 
远 进 行 下 去 。 当 所 有 可 能 的 推导 都 完成 后 ， 我 们 可 以 简单 地 查看 /是 否 在 这 个 过 程 所 产生 的 
函数 依赖 中 。Armstrong 公 理 的 完整 性 保证 ， 当 且 仅 当 / 是 推导 出 的 函数 依赖 中 的 某 一 个 时 ， 
fer', 

为 了 了 解 这 个 过 程 的 工作 过 程 ， 考 虑 如 下 函数 依赖 集 : F={AC-B,A-C, DD 一 4} 和 
G={A >B, A> C, DA, DB}。 我 们 可 以 用 Armstrong 公 理 来 证 明 这 两 个 集合 是 等 价 的 ， 即 G 
中 的 每 个 函数 依赖 被 PF 蕴涵 ， 反 之 亦 然 。 例 如 ， 为 证 明 4 一 B 被 F 萝 涵 ， 我 们 可 以 用 各 种 方法 来 
应 用 Armstrong 公 理 。 大 部 分 尝试 将 不 会 产生 任何 结果 ,但 有 一 些 尝 试 会 产生 结果 。 比 如 ， 下 
面 的 推导 会 建立 所 希望 的 绚 油 : 

a) 4-C 天 中 的 一 个 函数 依赖 

b)A>AC 从 a 和 Armstrong 增 广 公 理 得 出 

c)A>B 从 b，AC-BEF 和 Armstrong 传 递 公 理 得 出 

函数 依赖 4 ~ CAD 一 A 同时 属于 F 和 G， 因 此 这 个 推导 是 很 容易 的 。 对 G 中 的 DB ， 计 算 
机 会 尽力 使 用 Armstrong 公 理 直 到 推导 出 这 个 函数 依赖 。 一 段 时 间 后 ， 它 会 偶然 发 现 如 下 的 有 
效 推导 : | 

a) D-=A FF 中 的 函数 依赖 

bA~B 先前 所 推导 出 的 

c)D>B ， 根据 a，b 和 Armstrong 传 递 公理 得 出 
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数量 的 指数 级 大 小 ， 因 此 对 大 的 数据 库 模式 ， 设 计 者 要 花 很 长 时 间 才 能 看 到 结果 。 因 此 我 们 
将 开发 一 个 更 有 效 的 算法 ， 它 同样 是 基于 Armstrong 公 理 ， 但 使 用 起 来 更 方便 。 

6. 检测 函 数 依赖 的 蕴涵 

险 证 蕴涵 的 新 算法 的 思想 基于 属性 闭 包 (attribute closure). 

给 定 函数 依赖 集 F 和 属性 的 集合 X, HFF, XE X ELA: 

XxX; - {4| X- AEF} 


换 句 话 说 ， XSEMARBHAMEA, RH X -ARFHM. ER XCX., AAM 
R AEX. 、 那 么 根据 Armstrong 自 反 性 公理 ， 斑 一 4 是 平凡 函数 依赖 而 被 包括 在 内 的 每 个 函数 
依赖 集 所 蕴涵 。 

理解 F 的 闭 包 (BDF) 和 XX 的 闭 包 (GX) 是 相关 且 不 同 的 概念 是 很 重要 的 : FEAM 
依赖 的 集合 ， 而 好 是 属性 的 集合 。 

检测 函数 依赖 的 列 涵 的 更 有 效 的 算法 的 过 程 如 下 : 给 定 函 数 依赖 集 F 和 函数 依赖 一 了 ， 检 
WEBAYCK;. WETE, WAFA X- Y. Bil, mR YS XS, AFR MX-Y. 

这 个 算法 的 正确 性 可 由 Armstrong 公 理 证 明 。 如 果 了 C 六 ， 那 么 对 每 个 4 E YA X-ACF 
(根据 奈 的 定义 )。 根 据 函数 依赖 的 并 规则 ，F 列 涵 对 了。 相反 ， 如 果 了 了 XS, BAA 
BEY 了 ,使 BFXi。 因 此 ， 久 一 B 不 被 Ff? 蕴涵。 那么 F 不 蕴涵 对 一 了 ; MRA. MARR 
数 依赖 的 分 解 规 则 ， 它 将 会 也 莉 涵 X B. 

上 述 算法 的 核心 是 检测 一 个 属性 集 是 否 属于 入 。 因 此 ， 我 们 的 工作 还 没有 完成 : 我 们 需 
要 一 个 算法 来 计算 往 的 闭 包 ， 图 8-3 说 明了 此 算法 。 该 算法 的 基本 思想 是 ， 应 用 天 中 的 函数 依 
赖 来 扩大 属于 妹 的 属性 集 。 闭 包 的 初始 值 为 ， 因 为 我 们 知道 X BE GUTE. 

closure := X 


repeat 
old := closure 


if there is an FD Z > V e F such that Z € closure and V £ closure then 
closure := closure U V 
until old = closure 
return closure 





图 8-3 计算 属性 闵 包 X; 


算法 的 正确 性 可 以 用 归纳 法 进行 证 明 。 最 初 ， 闲 包 为 系 ， 因 此 豆 -closure 在 天 中 。 接 着 ， 
假定 在 图 8-3 的 repeat 循 环 的 某 个 中 间 步 曲 有 X -closure E F+， 并 给 定 一 个 函数 依赖 Z -= VEF 
有 ZCclosure， 我 们 可 以 应 用 通用 传递 规则 (参见 练习 8.7) RHE FAI X > closureU V. 
因此 ， 如 果 在 计算 结束 时 4 E closure, WAAE Xf. RUBEN: 如 果 4 E Xt, WA 
在 计算 结束 时 A E closure (参见 练习 8.8 )。 

和 不 加 区 别 地 使 用 Armstrong 公 理 的 思想 的 简单 算法 不 同 ， 图 8-3 算 法 的 运行 时 间 复 杂 度 与 
F 大 小 的 平方 成 正比 。 事 实 上 ， 在 [Beeri and Bernstein 1997] 中 给 出 一 个 计算 及 的 算法 ， 这 个 
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算法 的 运行 时 间 复 杂 度 与 的 大 小 是 线性 关系 。 这 个 算法 更 适合 计算 机 程序 ， 而 它 的 内 部 工作 
过 程 更 复杂 。 

例 8.4.1 检测 蕴涵 

考虑 关系 模式 ，R=( R;F), 其 中 R=ABCDEFGHI), ARKRMEFAS on T BRR: 
AB-C,D-E,AE-G,GD-H,1ID 一 J。 我 们 希望 检测 F 是 否 强 涵 ABD 一 GH 和 ABD > HJ。 

首先 计算 ABD; 。 以 closure=ABD 开 始 。 两 个 函数 依赖 可 以 用 在 图 8-3 的 第 一 次 迭代 中 。 根 
据 定义 ,使 用 4B 一 C， 得 到 cliosure=ABDC。 EB_RARM, HAD-E, El 
closure=ABDCE。 现 在 可 以 在 第 三 次 人 迁 代 中 使 用 函数 依赖 AE 一 G， 产 生 closure=ABDCEG。 这 
又 允许 将 GD 一旦 应 用 到 第 四 次 迭代 ， 得 到 cliosure=ABDCEGH。 在 第 五 次 迭代 中 ， 我 们 不 能 应 
用 任何 新 的 函数 依赖 ， 因 此 closure 不 再 改变 ， 循环 结束 。 有 ABD; =ABDCEGH. 

由 于 GH c ABDCEGH， 我 们 可 以 推出 F 蕴 涵 4BD 一 GH。 另 一 方面 ,HJ Z ABDCEGH, 
因此 Ff 不 蕴涵 4BD 一 HJ。 注意 ，F 蕴 涵 ABD 一 H。 

通过 上 述 测 试 蕴涵 的 算法 可 得 到 一 个 测试 一 对 函数 依赖 集 是 否 等 价 的 简单 算法 。 假 定 F 和 
G 是 这 样 两 个 集合 。 为 检测 它们 是 否 等 价 ， 我 们 必须 检测 G 中 每 个 函数 依赖 是 否 被 F 蕴 涵 ， 反 
之 亦 然 。 图 8-4 描 述 了 此 算法 。 





Input: F G — FD sets 
Output: true, if F is equivalent to G; false otherwise 
for each fE F do 


if G does not entail f then return false 
for each g € G do 

if F does not entail g then return false 
return true 





图 8-4 测试 函数 依赖 集 的 等 价 性 


8.5 范式 


为 消除 元 余 和 淮 在 的 更 新 异常 ， 数 据 库 理论 提出 几 个 模式 的 范式 (normal form )， 如 果 一 
个 模式 是 范式 中 的 一 种 ， 它 就 有 一 些 可 以 预测 的 性 质 。 最 初 ，[Codd 1970] 提 出 三 种 范式 ， 每 
一 种 范式 能 比 前 一 种 范式 消除 更 多 的 异常 。 

正如 Codd 所 介绍 的 ， 第 一 范式 (First Normal Form, 1NF) 等 价 于 关系 数据 模型 的 定义 。 
第 二 范式 (Second Normal Form, 2NF) 尝试 消除 某 些 法 在 异常 , 但 可 以 证 明 它 没有 实际 用 处 ， 
因此 不 讨论 它 。 

第 三 范式 (Third Normal Form, 3NF) 最 初 被 认为 是 “最 终 ” 范 式 。 但 是 ，Boyce 和 Codd 
很 快意 识 到 3NE 同 样 有 一 些 不 受 欢迎 的 印 数 依赖 ， 因 此 他 们 引入 了 所 谓 的 Boyce-Codd 范 式 
(BCNF)。 但 是 ， 尽 管 BCNF 更 受 人 欢迎 ,但 有 时 要 付出 代价 才能 达到 。 在 本 节 ， 我 们 定义 
BCNF 和 3NF。 后 续 章 节 会 提出 一 些 算法 ， 以 便 自动 地 将 包含 各 种 不 好 性 质 的 关系 模式 转换 为 
3NF 和 BCNF 的 模式 集 。 我 们 同样 会 研究 进行 这 些 转 换 的 代价 。 

在 本 章 的 最 后 ， 我 们 将 看 到 ， 某 些 元 余 不 是 由 函数 依赖 所 引起 的 ， 而 是 由 别 的 依赖 引起 。 
为 解决 这 个 问题 ， 我 们 引入 第 四 范式 (Fourth Normal Form，4NF)， 它 是 对 BCNF 的 进一步 扩展 。 





1. Boyce-Codd 范 式 

对 一 个 关系 模式 R=( BF) ( 瓦 是 R 的 属性 集合 ，F 是 和 R 关 联 的 函数 依赖 的 集合 ) 来 说 ， 
如 果 每 个 函数 依赖 X ~ 了 E 天 ， 那 么 若 下 面 两 个 条 件 有 一 个 为 真 ， 则 妇 是 Boyce-Codd 范 式 : 

。 了 CX ( 即 是 平凡 函数 依赖 ) 。 

。 式 是 R 的 超 键 。 

换 句 话说 ， 唯 一 的 非 平凡 函数 依赖 是 那些 键 在 功能 上 决定 一 个 或 多 个 属性 的 函数 依赖 。 

很 容易 看 出 (8.1) 中 的 关系 模式 PERSON1 和 HoBBY 是 BCNF， 因 为 唯一 的 非 平 几 函 数 依赖 是 
SSN > Name, Address。 它 应 用 到 以 SSN 作 为 键 的 PERSON1。 

另 一 方面 ， 考 虑 ($.1) 中 CREATE TABLE 语 句 所 定义 的 模式 PERSON 和 “(8.3) 的 SQL 语句 所 
定义 的 模式 HASAccouNT。 正 如 前 面 所 讨论 的 ， 这 些 语句 无 法 获取 到 一 些 重要 的 关系 ， 像 
(8.5) 中 函数 依赖 所 表示 的 。 这 些 函 数 依赖 中 的 每 一 个 都 违反 了 BCNF 的 要 求 : 它们 不 是 平凡 
的 ， 而 且 它们 的 左 侧 (SSN 和 AccountNumber) 不 是 各 自 模式 的 键 。 

注意 ,一 个 BCNF 模 式 可 以 有 多 于 一 个 的 键 。 比 如 ，R=(4BCD;F)， 其 中 F={4B 一 CD, AC> BD} 
有 两 个 键 4B 和 AC。 它 也 是 BCNF， 因 为 F 中 每 个 函数 依赖 的 左边 均 是 键 。 

BCNF 模 式 的 一 个 重要 性 质 是 它们 的 实例 不 包括 元 余 信 息 。 由 于 我 们 只 是 通过 实例 来 说 明 
元 余 问 题 ， 所 以 上 述 语 句 似乎 不 太 有 说 服 力 。 确 切 地 说 ， 什 么 是 元 余人 信息”? 比如， 对 上 述 提 
到 的 BCNF 模 式 R， 这 个 抽象 关系 是 否 存 储 了 元 余人 信息? 


A B C D 


1 1 3 4 
2 1 3 4 


从 表面 上 看 ， 该 模式 似乎 是 存储 了 元 余人 信息， 因为 这 两 个 元 组 除了 一 个 属性 外 ， 其 他 的 
都 一 致 。 然 而 ， 在 不 同 元 组 的 某 些 属性 上 有 相同 的 值 并 不 一 定 表明 元 组 存储 了 宛 余 信息 。 当 
某 些 属性 集 XX 的 值 确实 决定 另 一 个 属性 4 的 值 ， 即 存在 函数 依赖 ， 此 时 才 认 为 有 元 余 。 如 果 
两 个 元 组 在 上 有 相同 的 值 ， 那 么 它们 在 4 上 一 定 有 相同 的 值 。 如 果 我 们 只 将 了 和 A 之 间 的 关 
联 存 储 一 次 (在 一 个 单独 的 关系 中 )， 而 不 是 在 对 上 一 致 的 模式 R 的 一 个 实例 所 有 元 组 上 重复 
它 ， 那 么 元 余 就 会 被 消除 。 由 于 R 在 属性 BCD 上 没有 函数 依赖 ， 所 以 没有 元 余 信 息 会 被 存储 。 
关系 中 的 元 组 在 BCD 上 一 致 这 一 事实 只 是 巧合 。 例 如 ， 在 第 一 个 元 组 中 属性 D 的 值 可 以 从 4 变 
到 5， 而 无 需 考 虑 第 二 个 元 组 。 

DBMS 会 自动 消除 一 种 元 余 : 两 个 元 组 在 键 字段 有 相同 的 值 在 模式 的 任何 实例 中 是 禁止 
的 。 这 是 一 个 特例 : 键 确定 一 个 实体 ， 同 时 也 决定 描述 那个 实体 的 所 有 属性 的 值 。 由 于 BCNF 
的 定义 排除 了 不 包括 键 的 关联 ， 所 以 BCNF 模 式 的 关系 不 会 存储 元 余 信 息 。 因 此， 删除 与 更 新 
异常 不 会 在 BCNF 关 系 中 出 现 。 

有 多 于 一 个 键 的 关系 仍 会 有 插入 异常 。 为 说 明 这 一 点 ， 假 定 对 4BD 和 ACD 的 关联 被 加 到 
下 述 关系 中 : 


Own =|] > 
w 
AAP PTY 
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由 于 在 第 一 个 关联 中 的 属性 C 和 第 二 个 中 8 的 值 是 未 知 的 ， 所 以 我 们 用 NULL 填 充 缺 失信 
Eo 然而， 我 们 不 能 分 辨 新 加 进 的 元 组 是 否 相同 
一 个 实际 解决 方案 ， 即 SQL 标准 所 采纳 的 方案 ， 是 指定 一 个 键 为 主键 并 禁止 主键 的 属性 出 现 
空 值 。 

2. 第 三 范式 

对 于 一 个 关系 模式 R=( RR; F) ( RR 是 R 的 属性 集合 ，F 是 和 RR 关联 的 函数 依赖 的 集合 ) 来 说 ， 
如 果 对 每 个 函数 依赖 居 一 A E， 那 么 在 下 面 任何 一 个 条 件 为 真 的 情况 下 ，R 是 第 三 范式 : 

“4E 三 ，( 即 是 一 个 平凡 函数 依赖 ) 。 

。 叉 是 R 的 超 键 。 

。 WRASSE K, AE K.o 

注意 ，3NEF 定 义 的 前 两 个 条 件 与 BCNE 的 定义 相同 。 因 此 ，3NF 是 对 BCNF 要 求 的 一 个 放 
松 。BCNF 的 模式 一 定 是 3NE， 但 反之 则 不 然 。 例 如 ，(8.3) 所 示 的 关系 HASAccoUNT 是 3NF， 
因为 唯一 不 是 基于 键 约 束 的 国 数 依赖 是 AccountNumber- OfficeId， 而 OfficeId 是 键 的 一 部 分 。 

然而 ， 这 个 关系 不 是 BCNF， 如 前 所 示 。 

如 果 你 想 知 道 3NF 定 义 中 的 三 个 条 件 的 本 质 优点 ， 那么 答案 是 无 。 从 某 方 面 来 说 ，3NF 是 
在 寻找 BCNF 过 程 中 ， 被 错误 地 发 现 的 ! 它 能 保存 下 来 的 原因 是 ， 后 来 发 现 它 有 一 些 BCNF 没 
有 的 算法 性 质 。 我 们 在 随后 的 章节 会 讨论 这 些 问 题 。 

回忆 8.2 节 ，HAsAccouNT 的 关系 实例 也 许 会 存储 元 余 信 息 。 现 在 我 们 可 以 看 到 这 个 元 余 
的 出 现 ， 是 因为 AccountNumber 和 OfficeId 之 间 的 函数 依赖 ， 而 它 又 不 被 键 约束 所 蕴涵 。 

再 例如 ， 考 虑 先前 讨论 的 模式 PERSON。 这 个 模式 韦 反 了 3NF 的 要 求 ， 因 为 函数 依赖 SSN 一 
NAME 不 基于 键 约束 (SSN 不 是 超 键 )， 而 且 Name 不 属于 PERSON 的 某 个 键 。 然 而 ， 把 这 个 模 
式 分 解 成 (8.1) 中 的 PERSON1 和 HoBBY 会 得 到 既是 3NF 又 是 BCNF 的 两 个 模式 。 


8.6 分 解 的 性 质 


由 于 BCNF 模 式 中 没有 宛 余 ，3NF 中 元 余 也 是 有 限 的 ， 因 此 我 们 希望 把 一 个 给 定 的 模式 分 
解 成 一 个 模式 的 集合 ， 其 中 每 一 个 模式 都 是 BCNF 或 3NF。 

前 一 节 讨 论 的 主要 问题 是 3NF 没 有 完全 解决 元 余 问 题 。 因 此 ， 初 看 起 来 ， 没 有 理由 考虑 将 
3NF 作 为 数据 库 设 计 的 目标 。 然 而 ， 与 元 余 相 关 的 维护 问题 并 不 是 全 部 。 正 如 我 们 将 要 看 到 
的 ， 维 护 也 与 完整 性 约束 相关 。，3NF 分 解 在 维护 方面 有 时 比 BCNF 分 解 更 好 。 我 们 先 来 定义 
这 些 性 质 。 

回忆 8.2 节 ， 不 是 所 有 的 分 解 都 等 价 的。 比如 ， 对 (8.1) 所 示 的 PERSON 所 进行 的 分 解 就 是 
好 的 ， 而 (8.2) 则 毫 无 意义 。 是 否 有 客观 方法 来 评价 哪些 分 解 有 意义 ， 哪 些 没 有 音义? 并且 
这 个 客观 方法 是 否 能 解释 给 计算 机 ? 这 两 个 问题 的 答案 都 是 肯定 的 。 有 意义 的 分 解 称 为 无 损 
的 (lossless)。 在 介绍 这 个 概念 之 前 ， 我 们 需要 更 清楚 地 了 解 什么 叫 “ 分 解 。 


tE PS 











日 事实 上 ，HAsAccouNT 是 3NF 但 不 是 BCNF 的 最 小 可 能 例子 (参见 练习 8.5 )。 
O 例如 ， 最 初 的 表 中 的 一 个 完整 性 限制 只 有 在 对 被 分 解 的 表 做 连接 后 才能 进行 检测 ， 但 这 会 导致 运行 时 的 大 
量 开销 。 
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若 有 模式 R=( R; F)， 其 尺 是 模式 属性 的 集合 ，F 是 函数 依赖 的 集合 ， 那 么 模式 的 分 解 

(decomposition of a schema) 是 模式 的 一 个 集合 : 
R, =(R; F); R, =(R; F), = R, =(R,; F,) 

它 满 足 如 下 条 件 : 

1) R= UN,R, 

2) MEP I=L sn, FMF, 

定义 的 第 一 部 分 是 清晰 的 : 一 个 分 解 不 应 该 引入 新 的 属性 ， 它 也 不 应 该 丢失 原 模式 中 的 
属性 。 定义 的 第 二 部 分 说 明 一 个 分 解 不 应 该 引入 新 的 函数 依赖 (但 可 能 会 丢失 一 些 函数 依赖 )。 
后 面 会 对 第 二 个 要 求 进行 更 详细 的 讨论 。 

一 个 模式 的 分 解 自然 会 导致 它 的 关系 的 分 解 。 对 模式 R 的 一 个 关系 的 分 解 (decomposition 
of a relation) 会 产生 关系 的 集合 


r = 7, (T), r, =, (T), FIS i = XE (r) 


其 中 ，r 是 投影 运算 符 。 可 以 看 到 (参见 练习 8.9)， 如 果 r 是 R 的 一 个 有 效 实例 ， 那 么 每 
个 r 均 满足 已 中 的 所 有 函数 依赖 ， 因 此 每 个 r 是 模式 Ri 的 有 效 关 系 实例 。 分 解 的 目的 就 是 把 原 
来 的 关系 模式 r 替 换 为 rm 的 关系 集合 ， 其 中 它们 的 模式 组 成 了 分 解 的 原 模式 。 

根据 上 述 定义 ， 认 识 到 模式 分 解 和 关系 实例 分 解 是 两 个 不 同 但 相关 的 概念 是 很 重要 的 。 

应 用 上 述 定 义 到 我 们 的 例子 ， 我 们 可 以 看 到 把 PERSON 拆 分 为 PERSON1 和 HoBBY (参见 (8.1) 
和 图 8-1) 会 产生 一 个 分 解 。 把 PERSON 按 (8.2) 和 图 8-2 所 示 进 行 拆 分 ， 同 样 是 上 述 意 义 上 的 一 
个 分 解 。 它 明显 满足 分 解 的 第 一 个 条 件 。 它 同样 满足 第 二 个 条 件 ， 因 为 (8. DR 4 有 平凡 函数 依 
赖 ， 它 们 会 被 每 个 函数 依赖 集 所 蕴涵 。 

最 后 一 个 例子 表明 ， 上 述 分 解 的 定义 并 不 具备 一 个 分 解 所 有 好 的 性 质 ， 正 如 8.2 节 所 示 ， 
(8.2) 中 的 分 解 是 没有 意义 的 。 下 面 ， 我 们 将 介绍 分 解 的 其 他 一 些 有 意义 的 性 质 。 


8.6.1 无 损 分 解 与 有 损 分 解 


分解 Pei 由 于 分 解 后 数据 库 不 再 存储 关系 rz， 而 是 维护 

它 的 投影 ， 数 据 库 必须 能 够 从 利用 这 些 投影 重 构 最 初 的 关系 r。 不 能 重 构 r 意 味 着 分 解 
没有 表示 原 好 数据 库 的 信息 。( 就 像 银行 丢失 了 谁 拥 有 哪个 账户 的 信息 ， 或 者 更 精 ， 把 那些 账 

户 分 给 了 错误 的 储户 ! ) 

从 原则 上 说 ， 我 们 可 以 用 任何 能 够 保证 从 它 的 投影 中 重 构 r 的 计算 方法 。 然 而 ， 自 然 的 
(并 且 在 大 多 数 情况 下 比较 实际 ) 的 方法 是 进行 自然 联结 。 我 们 假定 r 当 且 仅 当 

r=r r+ bdr, 

时 ,，r 是 可 重 构 的 。 

重 构 是 模式 分 解 的 一 个 性 质 ， 而 不 是 这 个 模式 的 一 个 实例 。 在 数据 库 设 计 阶 段 ， 设 计 者 
操纵 的 是 模式 ， 而 不 是 关系 ， 对 模式 的 任何 变换 必须 保证 对 它 的 所 有 有 效 的 关系 实例 的 可 重 
构 性 。 
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这 个 讨论 会 产生 如 下 概念 。 模 式 R=( R ; 站 分 解 为 模式 集 
R, =(R; F), R, = (已 ; F), = R, =(R,; F,) 


是 无 损 的 ， 只 要 对 模式 R 的 每 个 有 效 实例 r， 都 满足 


rar, dr, D< … D< Fy 


其 中 ， 


N 
n =n (r), m, =m (T), +, T, = My (r) 


否则 一 个 分 解 则 是 有 损 的 (lossy). . 
根据 定义 ， 无 损 模式 分 解 可 以 保证 原始 模式 的 任何 有 效 实 例 可 以 利用 单独 分 解 的 模式 的 
投影 进行 重 构 。 注 意 ， 
rer, Kr A e bdr, 
对 任何 分 解 都 成 立 (练习 8.10)， 因 此 无 损 性 只 是 陈述 相反 的 结论 。 


r 2r Xr, A -e bdr, 


事实 
ror, r A … Tr, 


无 论 在 什么 条 件 下 成 立 ， 初 看 起 来 也 许 有 些 令 人 困惑 。 如 果 通 过 联结 r 的 投影 可 以 得 到 更 多 的 
元 组 ， 为 什么 这 样 一 个 分 解 会 称 为 “有 损 ”? 我 们 得 到 更 多 的 元 组 ， 而 不 是 更 少 ! 为 淤 清 这 
个 问题 ， 注 意 ， 我 们 这 里 所 丢失 的 不 是 元 组 而 是 关于 哪些 元 组 是 正确 的 信息 。 比 如 ， 考 虑 模 
式 PERSON 的 分 解 (8.2)。 图 8-2 表 示 图 5-2 的 PERSON 的 一 个 有 效 关 系 实例 的 相应 分 解 。 然 而 ， 如 
采 我 们 现在 计算 分 解 中 关系 的 自然 联结 (由 于 这 些 关系 没有 公共 属性 ， 会 变 为 笛 卡 儿 积 )， 我 
们 将 无 法 辨别 每 个 人 的 住址 和 每 个 人 的 爱好 。 姓 名 和 SSN 之 间 的 联系 也 会 丢失 。 换 句 话 说 ， 
当 重 构 原 始 关系 时 ， 得 到 更 多 的 元 组 与 得 到 更 少 的 元 组 同样 不 是 好 事情 ， 我 们 必须 得 到 原始 
关系 的 确切 的 元 组 集合 。 

现在 我 们 明白 了 无 损 的 重要 性 ， 我 们 需要 一 个 计算 机 算法 来 验证 这 个 性 质 ， 因 为 无 损 联 
结 的 定义 并 没有 提供 一 个 有 效 的 测试 ， 而 只 是 告诉 我 们 尝试 每 个 可 能 的 关系 。 这 是 不 太 可 行 
的 ， 而 且 效 率 也 不 高 。 

检测 得 到 "个 模式 的 一 个 分 解 是 否 为 无 损 分 解 的 通用 测试 是 存在 的 ， 但 有 些 复杂 。 我 们 可 
以 在 [Beeri et al. 1981] 中 找到 这 个 算法 。 然 而 ， 有 一 个 更 简单 的 用 来 检测 二 元 分 解 ( 即 分 解 为 
一 对 模式 ) 的 算法 。 这 个 测试 可 以 确定 分 解 结果 多 于 两 个 模式 的 无 损 性 ， 只 要 这 个 分 解 可 以 
通过 一 系列 的 二 元 分 解 得 到 即 可 。 由 于 大 部 分 分 解 是 以 这 种 方式 获得 的 ， 下 面 介绍 的 简单 的 
二 元 测试 对 大 部 分 实际 情况 都 是 有 效 的 。 

测试 二 元 分 解 的 无 损 性 

RR=( R; 六 是 一 个 模式 ， R=( Ri; Fi), Re=( R; 三 ) 是 R 的 一 个 二 元 分 解 。 当 且 仅 当 下 面 
的 某 个 条 件 为 真 时 ， 此 分 解 是 无 损 的 : 

“(RIiN R)> RIEF 

*(RiN Rd> REF 
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为 说 明 其 中 的 原理 ， 假 定 ( R1N R)> RE Pwo. Rie ROME, AA RHE 
个 子 集 的 值 决定 RA AREE., RARE R). BETERA ARAH. H 
F Rie RDPB, NRO BATCH TE he AA. Ak, en 8-5 
所 描述 ，m 的 基数 〈 元 组 的 个 数 ) 等 于 r 的 基数 ,rr 中 的 每 个 元 组 与 匡 = zj (7) 中 确切 的 一 个 
元 组 相 联结 〈 如 果 m 中 多 个 元 组 与 rm 中 一 个 元 组 联结 ， 则 RNA Rd 尺 : 将 不 会 是 一 个 函数 依赖 )。 
因此 ，r pq rz 的 基数 等 于 mr 的 基数 ,rm 的 基数 又 等 于 r 的 基数 。 由 于 r 必 须 是 r eq rz 的 子 集 ， 
因此 有 r = ri x mr。 相反 地 ， 如 果 上 述 两 个 国 数 依赖 都 不 成 立 ， 则 很 容易 构造 一 个 关系 r， 使 
r Cr pq rz。 这 个 构造 的 细节 作为 练习 8.11 。 

















EG A, A, —> R, 
图 8-5 无 损 一 元 分 解 的 元 组 结构 : r 的 一 行 与 r 的 一 行 的 联结 


上 述 测试 可 以 用 来 证 实 我 们 的 直觉 : PERsoN 分 解 为 PERSoON1 和 HoBBY 是 一 个 好 的 分 解 。 
PERSON1 和 HoBBY 属 性 的 交 是 {SSN}，SSN 是 PERsoN1 的 键 。 因 此 ， 这 个 分 解 是 无 损 的 。 


8.6.2 依赖 保持 分 解 


再 次 考虑 模式 HASAccoUuNT。 它 有 属性 AccountNumber、ClientId、 Officeld, ##H HMA 
依赖 为 : 

ClientId, OfficeId 一 AccountNumber (8.6) 

AccountNumber 一 OfficelId (8.7) 


根据 无 损 性 测试 ， 因 为 AccountNumber (两 个 属性 集 的 交 ) 是 第 一 个 模式 ACCTOFFICE 
的 键 ， 如 下 分 解 是 无 损 的 : 


AccTOFFICE = (AccountNumber, OfficeId; 
{AccountNumber 一 OfficeId}) (8.8) 
AccTCLIENT = (AccountNumber, ClientId; { }) 
尽管 分 解 (8.8) 是 无 损 的， 但 似乎 还 是 有 些 问 题 。AccrOFFIcE 保 持 函 数 依赖 (8.7)， 而 
与 ACCTCLIENT 关 联 的 函数 依赖 集 是 空 。 这 会 导致 原始 模式 中 的 函数 依赖 (3.6) 的 丢失 。 分 解 的 
两 个 模式 都 没有 可 以 容纳 这 个 函数 依赖 的 属性 ; 而 且 ， 这 个 函数 依赖 无 法 从 属于 模式 
AccTOFFICE 和 AccTCLIENT 的 函数 依赖 中 导出 。 
从 实际 来 说 ， 这 意味 着 尽管 把 模式 HASAccoUNT 的 关系 分 解 为 AccTOFFICE 和 AccTCLIENT 
的 关系 不 会 导致 信息 丢失 ， 但 它 也 许 会 由 于 丢失 函数 依赖 而 使 完整 性 约束 的 维护 代价 提高 。 
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和 函数 依赖 8.7) 可 以 进行 局 部 校 验 不 同 ， 对 关系 AccTOFFICE， 函 数 依赖 (8.6) 的 校 验 要 求 在 
校 验 前 先 计算 AccrOFFICE 和 AccTCLIENT 的 联结 。 在 这 种 情况 下 ， 我 们 认为 分 解 没有 保持 原始 
模式 的 依赖 。 我 们 现在 对 其 进行 定义 。 
考虑 模式 R = ( RR; PHBE 
R, =(R; F), R,=(E; F), =, R, =(R,; 五 ) 


是 一 个 分 解 。 根 据 定义 ，F 萤 涵 每 个 F,， 因 此 F 葛 涵 Ui Fi。 然 而 ， 这 个 定义 并 不 要 求 两 个 依赖 
KROME, UL FORM. 这 个 反 向 萤 涵 正 是 在 上 述 例 子 中 所 丢失 的 。 包 括 依赖 (8.6) 和 
(8.7) 的 HASAccouNT 的 函数 依赖 集 并 没有 被 分 解 (8.8) 的 依赖 的 并 所 蕴涵 ， 它 们 的 并 只 有 一 
个 依赖 AccountNumber ~ OfficeId。 正 因为 这 样 ，(8.8) 不 是 一 个 依赖 保持 的 分 解 。 

正式 地 说 ， 若 当 且 仅 当 


R， =(R; F), R, =(R,; BE), … R, =(R,; F,) 
Aa Am A A g tki Erm Uar, MRR R; F) 的 一 个 依赖 保持 的 分 解 


(dependency-preserving decomposition ) 。 

F 中 的 一 个 函数 依赖 f 不 在 任何 F 中 并 不 意味 着 这 个 分 解 不 是 依赖 保持 的 ， 因 为 f 也 许 会 
被 Ur 所 强 涵 。 在 这 种 情况 下 ， 保 持 作为 函数 依赖 不 需要 做 额外 的 努力 ， 如果 UL, Fi 被 保 
持 ， 那 么 了 同样 也 会 被 保持 。 只 有 当 f PUL FA, PORE RRR TEN, 而且 f 
的 维护 要 求 一 个 联结 。 

根据 定义 ， 上 述 HASAccouNT 分 解 不 是 依赖 保持 的 ， 这 正 是 错误 所 在 。 存 在 于 原始 模式 中 
而 在 分 解 中 丢失 的 依赖 成 为 关系 间 的 约束 ， 它 不 能 进行 局 部 维护 。 每 一 次 改变 分 解 中 的 关系 
时 ， 只 有 在 原始 关系 重 构 后 才能 检测 是 否 满足 关系 间 的 约束 。 为 说 明 这 个 问题 ， 考 虑 图 8-6 的 
HASACCOUNT 分 解 。 






B123 111111111 SB01 
A908 123456789 MNOS 


HasAccount 


B123 111111111 
A908 123456789 
AccTOFFICE AccTCLIENT 


图 8-6 HASAccoUNT 关 系 的 分 解 


如 果 我 们 把 元 组 <B567,SB01> 加 到 关系 AccTOFFIcE 中 ， 把 元 组 <B567,111111111> 加 到 
ACCTCLIENT 中 ， 这 两 个 关系 仍 满 足 它们 的 局 部 函数 依赖 (事实 上 ， 从 (8.8) 可 看 出 只 有 
AccTOFFICE 有 依赖 要 被 满足 )。 相 反 地 ， 在 更 新 后 ， 关 系 间 的 函数 依赖 (8.6) 没有 被 满足 ， 
但 这 并 不 很 明显 。 为 验证 这 个 结论 ， 我 们 必须 联结 这 两 个 关系 ， 如 图 8-7 所 示 。 我 们 现在 可 看 
到 在 更 新 过 的 HAsSAccouNT 关 系 中 ， 前 两 个 元 组 违反 了 约束 (8.6). 








AccountNumber Officeld 









B123 SB01 
A908 MNO8 








Officeld 


111111111 
114111111 
123456789 








HasAccountT 


B123 111111111 
B567 141414111 
A908 123456789 


AccountNumber Officeld 
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ACCTOFFICE ACCTCLIENT 


图 8-7 在 插入 几 行 后 的 HAsSAccouNT 和 它 的 分 解 


下 一 个 问题 是 检测 一 个 分 解 是 否 是 依赖 保持 的 难度 。 如 果 我 们 已 经 有 了 一 个 分 解 ， 它 的 
结果 是 附属 于 局 部 模式 的 函数 依赖 的 集合 ， 那 么 可 以 在 线性 时 间 内 检测 出 其 是 否 是 依赖 保持 
的 。 我 们 只 要 检测 原始 集合 的 每 个 函数 依赖 是 否 被 局 部 模式 的 函数 依赖 的 并 所 蕴涵 。 对 每 个 
这 样 的 测试 ， 我 们 可 以 使 用 8.4 节 介绍 的 二 次 属性 闭 包 算法 。 

实际 上 ， 这 种 情况 更 复杂 。 通 常 ， 我 们 (和 计算 机 算法 ) 必须 先决 定 如 何 拆 分 属性 集 以 
组 成 分 解 ， 此 时 才能 把 函数 依赖 添加 到 那些 属性 集中 。 如 果 文 U 了 C5 ， 则 我 们 可 以 把 函数 
依赖 了 一 了 添加 到 属性 集合 5 。 下 面 我 们 会 更 正式 地 说 明 这 个 问题 。 

考虑 模式 R=( R; F)， 对 模式 R 的 关系 r 和 属性 集合 5 ， 有 5CRK。 如 果 5 是 R 分 解 的 一 个 
模式 ， 在 xs(r) 上 可 以 保证 的 函数 依赖 是 了 了 E 下， 有 了 C5。 这 会 产生 如 下 概念 : 

n (F)={X> FIX >Y EF* and XUY C3) 
这 称 为 函数 依赖 集 F 在 属性 集 5 ERK (projection). 

对 函数 依赖 投影 的 概念 找到 了 一 种 在 只 知道 如 何 拆 分 原始 模式 时 构造 分 解 的 方法 。 如 果 
R=( 愉 ;及 是 一 个 模式 ， 枣 ,，…， 玉 ,是 属性 的 子 集 ， AR=|] Ri 那么 模式 (Rite (PF), e, 
(Ru TRE) 的 集合 是 一 个 分 解 。 给 定 分 解 中 的 一 个 属性 集 ， 因 为 通过 投影 ， 我 们 总 能 决定 
相应 的 函数 依赖 集 ， 因 此 当 指 定 模式 分 解 时 ， 通 常 忽 略 掉 函数 依赖 。 

因此 构造 分 解 涉及 计算 函数 依赖 的 投影 。 这 个 计算 涉及 对 F 闭 包 的 计算 8 ， 它 与 F 大 小 的 
指数 成 正比 。 如 果 这 个 代价 被 算 到 计算 依赖 保持 的 代价 中 ， 这 个 检测 同样 是 指数 级 的 。 因 此 ， 
为 了 测试 一 个 分 解 的 无 损 性 ， 令 人 感 兴趣 的 是 我 们 不 需要 计算 属于 局 部 模式 的 函数 依赖 。 早 
期 呈现 的 测试 使 用 函数 依赖 的 原始 集合 Ff， 并 且 与 F 大 小 呈 线 性 关系 。 

综 上 所 述 ， 我 们 考虑 模式 分 解 的 两 个 重要 性 质 : 无 损 性 和 依赖 保持 。 我 们 也 可 以 看 一 个 
例子 ， 一 个 关系 (HasAccount) 是 无 损 的 ， 但 分 解 为 BCNF 却 不 是 依赖 保持 的 (就 像 我 们 将 
要 看 到 的 ， 它 没有 一 个 BCNF 分 解 会 满足 这 两 个 性 质 )。 这 两 个 性 质 哪 一 个 更 重要 ? 答案 是 无 
损 性 是 必需 的 ， 而 依赖 保持 尽管 也 是 我 们 所 希望 的 ， 但 却 是 可 选 的 。 原 因 是 有 损 分 解 会 丢失 


O ”有 一 种 方法 可 以 避免 计算 完全 的 闲 包 RP+*， 但 最 坏 情 况 下 的 复杂 度 是 一 样 的 。 
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原始 数据 库 中 的 信息 ， 这 是 不 可 接受 的 。 而 不 保持 函数 依赖 的 分 解 在 数据 库 改 变 并 且 需 要 检 
测 关 系 间 约束 时 才 会 导致 计算 开销 。 


8.7 分 解 BCNF 的 一 个 算法 


我 们 现在 准备 介绍 第 一 个 分 解 算法 。 假 设 R=( RR ;所 是 一 个 关系 模式 ， 它 不 是 BCNF 的 。 图 
8-8 的 算法 通过 不 断 拆 分 R 为 更 小 的 子 模式 来 构造 一 个 新 的 分 解 ， 因 此 在 每 一 步 ， 新 的 数据 库 
模式 中 违反 BCNF 的 函数 依赖 比 前 一 次 迭代 更 少 (参见 练习 8.13)。 因 此 ，、 这 个 算法 总 会 终止 ， 
并 且 结 果 中 的 所 有 模式 都 符合 BCNF。 


Input:R = (R; F) 
Decomposition := R 
while there is a schema S = (S; F^ in Decomposition that is not in BCNF do 
/* Let X > Y bean FD in Fsuch that XY ¢ S 
and it violates BCNF. Decompose using this FD */ 


Replace S in Decomposition with Schemas S4 = (XY; 万 ) 
and S) = (S—Y)UX; F», where F and A are all the FDs 
from F’ that involve only attributes in their respective schemas 
end 
return Decomposition 





图 8-8 无 损 分 解 为 BCNF 


为 了 理解 BCNF 分 解 算法 的 工作 原理 ， 再 次 考虑 HASAccoUNT 例 子 。 这 个 模式 不 满足 
BCNEFE， 因 为 函数 依赖 AccountNumber ~ OfficeId 的 左边 不 是 超 键 。 因 此 ， 在 图 8-8 的 while 循 
环 中 我 们 使 用 这 个 函数 依赖 来 拆 分 HASAccouNT。 结 果 正 是 我 们 在 (8.8) 中 看 到 的 分 解 。 

下 一 个 例子 更 复杂 也 更 抽象 。 考 虑 关系 模式 R=( 下; F), HP R =ABCDEFGH (回忆 A、B 
等 表示 属性 名 )， 函 数 依赖 集 F 是 

ABH>C 

A~DE 

BGH >F 

F> ADH 

BH- GE 

为 应 用 BCNF 分 解 算法 ， 我 么 首先 需要 确定 违背 BCNF 的 函数 依赖 ， 即 左边 不 是 超 键 的 那 
些 函 数 依赖 。 我 们 可 以 看 到 第 一 个 函数 依赖 没有 违背 BCNF， 因 为 属性 闭 包 (ABH)+ (用 图 
8-3 所 示 的 算法 进行 计算 ) 包含 所 有 模式 属性 ， 因 此 4BH 是 超 键 。 然 而 ， 第 二 个 函数 依赖 ， 
A 了 DE 违背 了 BCNF， 因 为 4 的 属性 闭 包 是 A4DE， 因 此 A4 不 是 超 键 。 我 们 可 以 使 用 这 个 函数 依 
HE YR: 

R, = (ADE; {A > DE}) 

R, = (ABCFGH; { ABH >C , BGH- F , F> AH, BH~G}) 

EE, YROF-ADHA{ FAH, F-D}, 4 BH->GEĄ{ BH>G, BH>E }， 其 中 一 些 
水 数 依赖 FD 和 BH 一 EE 就 会 丢失 ， 因 为 没有 新 的 模式 包含 这 些 函 数 依赖 所 用 的 所 有 属性 。 然 
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而 ,情况 看 起 来 还 是 不 错 ， 因 为 从 新 模式 Ri 和 好 ;中 的 函数 依赖 一 A 如 , A> DEW LAE Ag 
依赖 FD。 因 此 ， 如 果 维 护 这 两 个 依赖 的 有 效 性 ， 则 -DD 的 有 效 性 也 同样 被 维护 。 检 验 这 两 
个 依赖 是 容易 的 ， 因 为 每 一 个 依赖 的 属性 被 限制 在 单个 关系 中 。 类 似 地 ,同样 可 以 导出 BH 一 E， 
因为 限制 到 风 入 在 Ri 和 RR 中 的 函数 依赖 的 BA 的 属性 闲 包 中 包含 E。( 使 用 图 8-3 的 算法 进行 验 
WE! ) 因此 上 述 分 解 是 依赖 保持 的 。 

容易 看 到 ，R 1 满足 BCNF， 因 此 BCNF 分 解 算法 必须 关注 R,。 函 数 依赖 ABH 一 C 和 BGH > 
F 没 有 违背 R 中 的 BCNF， 因 为 4BH 和 8GH 都 是 超 键 。 因 此 ， 它 们 也 不 违背 R; 的 BCNF (ERA 
R 属 性 的 一 个 子 集 )。 明 显 违背 BCNF 的 函数 依赖 是 FA 五 ， 因 此 算法 会 找到 这 个 函数 依赖 ， 
并 对 RR 进行 相应 地 拆 分 。 

R,, = (FAH; {F > AH }) 

Rz = (FBCG; {}) 

现在 模式 Rs, 和 RR 都 满足 BCNF (R2s 是 平 几 的， 因为 它 没有 函数 依赖 )。 然 而 ， 代 价 是 R， 
中 的 函数 依赖 ABH 一 C , BGH 一 F 和 BH G 现 在 没有 容 身 之 地 。 而 且 ， 这 些 函 数 依赖 都 不 能 用 
幅 在 Ri1、R2! 和 R2s 中 的 函数 依赖 推导 出 来 。 比 如 ， 在 考虑 其 函数 依赖 集 的 情况 下 ,计算 (4BD* 
得 到 A4BHDE， 它 不 包括 C， 因 此 无 法 推出 4BH-C。 这 样 ， 我 们 得 到 了 R 的 三 个 BCNF 模 式 : 
R,、R2 和 了 R2 的 一 个 非 依赖 保持 分 解 。 

这 个 分 解 并 不 是 唯一 的 。 例 如 ， 如 果 我 们 的 算法 在 第 一 次 迭代 中 选择 出 刁 ~ ADH, WW — 
个 分 解 将 是 

R, = (FADH:{F > ADH}) 

R, = (FBCEG;{}) 

这 并 不 是 最 后 的 差别 。 尽 管 这 两 个 模式 都 满足 BCNF ， 但 在 分 解 R,、R2 和 Ra2 中 的 一 些 函 
数 依赖 现在 丢失 了 。 

BCNF 分 解 算法 的 性 质 

首先 最 重要 的 是 ， 图 8-8 的 BCNF 分 解 算法 总 会 产生 一 个 无 损 分 解 。 为 说 明 这 一 点 ， 考 虚 
包含 属性 集 和 了 和 ( § -了 )U 久 的 两 个 模式 ， 来 代替 算法 中 的 模式 S=( 5 , F) E, 
XYN((S-¥)UXK)=X, AFX-Y EF, AX YN((S-Y)UX)IXY. & 
据 二 元 分 解 的 无 损 性 测试 可 知 ，{ 对 了 ，( 5 -了 )U 多} 是 $S 的 无 损 分 解 。 这 意味 着 在 我 们 算 
法 的 每 一 步 ， 我 们 用 无 损 分 解 来 代 赫 一 个 模式 。 这 样 ， 根 据 练习 8.12， 这 个 算法 最 终 产 生 的 
分 解 是 无 损 的 。 . 

BCNF 算 法 产生 的 分 解 是 否 总 是 依赖 保持 的 ? 我 们 可 以 看 到 情况 并 非 如 此 。HASAccouNT 
的 分 解 (8.8) 不 是 依赖 保持 的 。 而 且 ， 容 易 看 到 没有 HASAccouUNT 的 分 解 (不 仅 是 这 个 特定 
算法 产生 的 ) 是 既 无 损 又 依赖 保持 的 。 实 际 上 ， 只 有 三 个 分 解 可 以 进行 ， 我 们 可 以 把 它们 都 
检测 一 下 。 

最 后 ， 我 们 看 到 BCNF 分 解 算法 是 非 决 定性 的 。 最 终 的 结果 取决 于 While 循环 中 国 数 依赖 
被 选择 的 顺序 。 数 据 库 设计 者 可 以 根据 个 人 品味 选择 分 解 ， 也 可 以 根据 客观 标准 选择 分 解 。 
比如 ， 一 些 分 解 也 许 是 依赖 保持 的 ， 而 另外 一 些 分 解 则 不 是 ; 一 些 分 解 也 许 会 导致 更 少 的 国 
数 依赖 作为 关系 间 限 制 (tekn, JR., Roi. Rafe BRL PELE R 、R; 分 解 好 )。 一 些 
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属性 集 更 可 能 被 一 起 查询 ， 因 此 最 好 不 要 在 分 解 中 将 它们 分 开 。 下 一 节 描 述 了 一 个 通用 的 方 
法 ， 以 帮助 我 们 选择 BCNF 分 解 。 


8.8 3NF 模 式 的 合成 


我 们 已 经 看 到 ， 一 些 模 式 〈 如 图 8-7 中 的 HASAccoUNT) 在 不 能 再 分 解 为 BCNF 的 情况 下 仍 
保持 依赖 。 然 而 ， 如 果 我 们 愿意 分 解 为 3NF 而 不 是 BCNF， 那 么 就 有 可 能 得 到 依赖 保持 分 解 
(但 3NF 也 许 会 包含 元 余 )。 

在 介绍 3NF 分 解 算法 前 ， 我 们 介绍 最 小 稚 盖 (minimal cover) 的 概念 ， 它 非常 简单 。 我 们 
知道 函数 依赖 集 也 许 看 起 来 完全 不 同 ， 但 却 逻 辑 上 等 价 。 图 8-4 呈 现 了 一 个 相当 直观 的 方法 来 
测试 相等 性 。 由 于 可 能 会 有 很 多 函数 依赖 集 等 于 任何 给 定 的 集合 ， 所 以 我 们 希望 有 一 个 函数 
依赖 集 可 以 视 为 是 “规范 的 ”。 但 定义 一 个 唯一 的 规范 集 不 是 一 件 容 易 的 事 ， 但 最 小 覆盖 的 概 
念 与 之 很 相似 。 


8.8.1 最 小 覆盖 


F 是 函数 依赖 集 。F 的 最 小 覆盖 是 一 个 函数 依赖 集 G， 它 有 如 下 性 质 : 

D G 等 价 于 F (但 可 能 与 F 不 同 )。 

2) G 中 的 所 有 函数 依赖 形 如 XK +A, ARPA RTE. 

3) 通过 如 下 两 个 方法 不 可 能 使 G“ 更 小 ”( 并 且 仍 满足 前 两 个 性 质 ): 

a. 删除 一 个 函数 依赖 。 
b. 从 函数 依赖 中 删除 一 个 属性 。 

很 明显 ， 根 据 函 数 依赖 分 解 的 规则 ， 很 容易 把 F 转 换 为 等 价 的 函数 依赖 集 ， 使 它 的 右边 为 
单个 属性 。 然 而 ， 性 质 3 更 微妙 。 在 介绍 计算 最 小 覆盖 的 算法 前 ， 我 们 用 一 个 具体 的 例子 进行 
说 明 。 

考虑 属性 集 4BCDEFGH 和 如 下 的 函数 依赖 集 F: 

ABH >C 

A>D 

C>E 

BGH>F 

F>AD 

E>F 

BH>E 

由 于 并 非 所 有 函数 依赖 的 右边 为 单个 属性 ， 我 们 可 以 使 用 分 解 规 则 来 获得 满足 最 小 覆盖 
的 前 两 个 性 质 一 个 函数 依赖 集 : 

ABH => C 

A>D 

C>E 

BGH>F 
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FA (8.9) 
F-D 

E-F 

BH- E 


WBE, BGH -> FRBH- EAE FP Bh, F> DRF- AMA- DAAM. Ale, E 


剩 下 


ABH>C 
A>D 

C-E 

F>A l (8.10) 
E-F 

BH-E 


通过 计算 属性 闭 包 ， 容 易 验证 这 些 函 数 依赖 均 不 是 元 余 的 ; 即 我 们 不 能 简单 地 从 这 个 集 


合 丢 掉 一 个 函数 依赖 而 不 牺牲 与 原始 集合 F 的 等 价 性 。 然 而 ， 这 个 结果 集 是 F 的 最 小 覆盖 吗 ? 
答案 是 否定 的 ， 因 为 从 第 一 个 函数 依赖 可 以 删除 属性 4。48 > CHRR 


BH >C 

A~D 

CE 

FA (8.11) 
E~F 

BH-E 


Areata, BH- CRRA(8.10) Hew. B—- TSA TL (8.11) 通过 计算 48BH 的 属性 闭 包 
进行 验证 ， 第 一 个 事实 可 以 根据 (8.10) 通过 计算 BA 的 属性 闭 包 进 行 验证 。 很 容易 得 出 这 两 个 
集合 是 等 价 的 ， 因 此 (8.10) 不 是 最 小 种 盖 。 令 人 感 兴趣 的 是 ， 在 元 余 属性 4 被 移 除 后 ， 集 合 
(8.11) 仍然 不 是 最 小 覆盖 ， 因 为 BH 一 E 是 元 余 的 。 去 除 这 个 函数 依赖 后 最 终 得 到 了 最 小 覆盖 。 





计算 最 小 覆盖 的 算法 如 图 8-9 所 示 。 步 又 1 根据 冰 数 依赖 的 右边 对 它 进 行 简单 拆 分 。 比 
> X tABEEHRA X >A X >B. 


Input: a set of FDs F 
Output: G, a minimal cover of F 


Step 1: G:= F, where all FDs are converted to use singleton-attributes on 
the right-hand side 


Step 2: Remove all redundant attributes from the left-hand sides 
of FDs in G 
Step 3: Remove all redundant FDs from G 


return G 





图 8-9 最 小 覆盖 的 计算 
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SRAM DWE RUBE TA. WEE, IENEN X-A © G 和 
G/M © 又 ， 我 们 需要 检测 ( 了 -8) A 是 否 被 G 所 弄 涵 。 如 果 手 工 进行 的 话 ， 这 是 一 项 非 
常 桔 燥 的 工作 。 在 上 述 例子 中 ， 当 检测 到 B= C 被 函数 依赖 集 (8.10) 所 蕴涵 时 ， 就 执行 这 
个 步 又 ， 这 就 允许 我 们 删除 4B 甩 ~ C 中 的 宛 余 属性 4。 步 又 三 通过 另 一 个 枯燥 的 算法 执行 : 对 
每 个 8 E G， 检 测 函 数 依赖 是 否 被 G-g 所 蕴涵 。 

注意 ， 图 8-9 的 算法 中 ， 步 又 2 和 3 不 能 反 过 来 进行 ， 在 执行 步 又 2 之 前 执行 步 又 3 并 不 总 是 
返回 景 小 覆盖 。 事 实 上 ， 我 们 已 经 看 到 这 个 现象 :通过 从 (8.9) 移 去 宛 余 函 数 依赖 得 到 集合 
(8.10) ; 通过 删除 宛 余 属性 得 到 集合 〈8.11)。 然 而 ， 这 个 结果 仍 有 宛 余 函 数 依赖 (BH E). 
另 一 方面 ， 如 果 我 们 先 从 (8.9) 移 去 元 余 属性 ， 可 得 到 

BH>C 

A>D 

C>E 

BH>F 

F>A 

F>D 

E> F 

BH>E | 

接着 移 去 元 余 的 函数 依赖 BH-F，F-D 和 BH E 会 产生 如 下 景 小 覆盖 

BH-C 

A>D 

C>E 

F>A (8.12) 

E-F. 


8.8.2 通过 模式 合成 的 3NF 分 解 


构造 依赖 保持 的 3NF 分 解 的 算法 与 BCNEF 的 原理 大 不 相同 。3NF 算 法 从 单独 属性 开始 把 它 
们 组 合 为 模式 , 而 不 是 从 一 个 大 的 模式 开始 逐步 分 割 它 。 因此 , 它 被 称 为 3NF 合 成 (Synthesis ) 。 
给 定 模式 R=( RR; FF)，R 是 属性 的 超 集 ，F 是 函数 依赖 的 集合 ， 该 算法 分 为 四 步 。 

1) 找到 FF 的 最 小 覆盖 G。 

2) 把 G 划 分 为 函数 依赖 集 G1,…,G,， 每 个 G, 的 左 半 部 相同 。( 没 有 必要 假定 不 同 的 G; 左 边 的 
部 分 相同 ， 但 把 左边 部 分 相同 的 集合 进行 合并 是 一 个 好 的 思想 。) 

3) 对 每 个 G,， 组 成 关系 模式 R=( Ri; Gi)， 尼 :是 Gi; 中 所 涉及 到 的 所 有 属性 的 集合 。 

4) 如 果 某 个 屎 是 模式 R 的 超 键 ( 即 (RD)r= RR )， 则 完成 分 解 ， 即 Ri…,R, 是 所 要 的 分 解 。 
RRA R ;是 RR 的 超 键 ， 让 Ro 成 为 包含 R 的 键 的 属性 的 集合 ，Ro = ( Ro; {}) 为 一 个 新 的 模式 。 
HA Ro, Ri, RARE AT ERK. 

注意 ， 完 成 步骤 3 后 所 获得 的 模式 的 集合 也 许 还 不 是 一 个 分 解 ， 因 为 R 的 一 些 属性 可 能 会 
Ek (参见 下 面 的 例子 )。 然 而 , ,任何 丢失 的 属性 在 步骤 4 中 会 重新 找到 ， 因 为 这 些 属性 必须 
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是 R 键 的 一 部 分 (练习 8.25)。 

容易 看 出 ， 上 述 算法 的 结果 是 一 个 依赖 保持 的 分 解 。 通 过 构造 ，G 中 的 每 个 函数 依赖 都 被 
包括 在 内 ， 因 此 G=U G,。 根 据 最 小 覆盖 的 定义 ，G+ = F*，F 被 保持 了 。 

同样 很 明显 ， 每 个 R; 是 一 个 3NF 模 式 ， 因 为 只 有 与 R; 关 联 的 函数 依赖 在 G; 中 ， 而 且 它 们 左 
边 的 部 分 相同 (因此 是 R; 的 一 个 超 键 )。 似 乎 每 个 R; 也 满足 BCNF， 但 不 要 被 蒙 项 了 : G; 中 的 
函数 依赖 也 许 并 不 是 唯一 在 R; 中 成 立 的 ， 因 为 G* 也 许 有 其 他 的 函数 依赖 ， 它 们 的 属性 集 完 全 
被 包含 在 尺 , 中 。 为 说 明 这 一 点 ， 考 虑 我 们 曾 试 过 的 真实 模式 HAsAccouNT 的 一 个 稍微 的 修改 。 
这 里 玉 包 含 属性 AccountNumber、ClientId、Officeld 和 DateOpened，F 包 含 函 数 依 赖 ClientId.、 
”Officeld + AccountNumber#flAccountNumber > OfficeId、DateOpened。 上 述 算 法 会 得 到 两 个 模 
式 : 

R, = ({ClientId,OfficeId,AccountNumber}, 

{ClientId,OfficeId -> AccountNumber}) 


R2 = ({AccountNumber ,OfficeId,DateOpened}, 
{AccountNumber 一 OfficeId,DateOpened}) 


经 过 仔细 检查 可 以 发 现 ， 尽 管 AccountNumber ~ OfficeId 没 有 在 Ri 中 显 式 地 指定 ， 对 那个 
模式 的 属性 它 是 一 定 成 立 的 ， 因 为 这 个 函数 依赖 被 R, 隐 含 说 明 。 

为 理解 考虑 RI 时 要 考虑 Rs 的 函数 依赖 的 原因 ，、 注 意 属 性 对 AccountNumber，OfficeId 表 示 
Ri 和 Rs 中 同样 的 真实 世界 联系 ， 因 此 如 果 R; 中 的 元 组 遵从 这 对 属性 上 的 约束 ， 而 Ri 中 的 元 组 
不 遵从 属性 上 的 约束 ， 这 会 导致 不 一 致 。 

回 到 我 们 的 最 初 问题 ， 上 述 讨论 表明 我 们 的 合成 算法 所 产生 的 模式 也 许 有 左边 部 分 不 同 
的 函数 依赖 ， 因 此 遵从 3NF 并 不 是 很 明显 。 然 而 ， 可 以 证 明 上 述 算 法 总 会 产生 3NF 分 解 (参见 
练习 8.14)。 

最 后 的 问题 是 合成 算法 是 否 会 产生 输入 模式 的 无 损 分 解 。 答 案 是 肯定 的 ， 但 证 明 这 一 点 比 
证 明 3NF 性 质 更 困难 。 尽 管 不 是 很 明显 ， 实 际 上 获得 无 损 性 是 那个 算法 的 步 又 4 的 唯一 目的 。 

对 一 个 3NEF 合 成 更 复杂 的 例子 ， 考 虑 (8.9) 中 带 有 函数 依赖 的 模式 。 这 个 集合 的 最 小 覆盖 
是 (8.12)。 由 于 这 里 没有 两 个 函数 依赖 左边 的 部 分 相同 ， 我 们 以 下 列 模式 结束 : (BHC:BH OC), 
(AD;A > D) (CE;C > E),(FA;F > AWA R(EF;E> F). 注意 ， 这 些 模 式 没 有 一 个 组 成 全 部 属性 集 的 
超 键 。 比 如 ，BHC 的 属性 闭 包 并 不 包括 G。 事 实 上 ， 属 性 G 没 有 包括 在 任何 模式 中 ! 因此 ， 根 
据 我 们 对 步骤 4 目的 评价 ， 这 个 分 解 并 不 是 无 损 的 (事实 上 ， 它 不 是 一 个 分 解 ! )。 为 使 它 是 
无 损 的 ， 我 们 进行 步 又 4， 加 入 模式 (BCGH;{}). 


8.8.3 通过 3NF 合 成 的 BCNF 分 解 


那么 ， 如 何 利 用 3NF 合 成 帮助 设计 BCNF 数 据 库 模式 ?答案 很 简单 :为 了 把 一 个 模式 分 解 
为 BCNF 关 系 ， 首 先 不 要 使 用 BCNF 算 法 。 应 该 使 用 3NF 合 成 ， 它 是 无 损 的 而 且 保证 了 保持 依 
赖 。 如 有 果 结 果 模 式 符合 BCNF (正如 我 们 前 面 的 例子 )， 则 不 必 再 采取 进一步 的 措施 。 然 而 ， 
如 果 结 果 中 的 某 个 模式 不 在 BCNF 中 ， 则 使 用 BCNF 算 法 来 拆 分 它 ， 直 到 没有 违背 BCNF 的 模 
式 存在 为 止 。 对 每 个 3NF 合 成 产生 的 非 BCNF 模 式 重复 这 一 步 。 

这 个 方法 的 优点 是 ， 如 果 一 个 无 损 且 依赖 保持 的 分 解 存 在 ， 则 3NF 合 成 很 可 能 会 找到 它 。 
如 果 在 第 一 阶段 后 一 些 模 式 不 是 BCNF， 那 么 一 些 函数 依赖 的 丢失 是 不 可 避免 的 (练习 8.26)。 
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但 至 少 我 们 已 经 尽力 了 。 下 面 用 一 个 完整 的 例子 来 说 明 上 述 方法 。 

例 8.8.1 模式 合成 与 分 解 的 结合 

假定 属性 集 是 St( 学 生 )、C( 课 程 )、Sem( 学 期 )、P( 教 授 ) 、T( 时 间 ) 和 R( 地 点 )， 其 中 有 下 列 
国 数 依赖 : 
St C Sem -> P 

P Sem -> C 

C Sem T -> P 

P Sem T > CR 


P Sem C T -> R 
P Sem T -> C 


这 些 函 数 依 赖 可 以 应 用 在 一 个 大 学 中 ， 同 一 门 课程 的 多 个 班级 可 以 在 同一 个 学 期 开设 
(因此 提供 课程 和 学 期 名 并 不 能 唯一 地 确定 一 个 教授 ) ， 一 个 教授 一 学 期 只 教 一 门 课 程 〈 因 此 
提供 教授 和 学 期 名 可 以 唯一 确定 一 门 课 程 )， 一 门 课程 的 所 有 班级 在 不 同 的 时 间 教 。 

我 们 首先 找到 上 述 集 合 的 一 个 最 小 覆盖 ; 第 一 步 是 拆 分 函数 依赖 集 的 右边 部 分 为 单个 属性 。 

St C Sem -> P 

P Sem -> C 

C Sem T -> P 

P Sem T -> C 

P Sem T -> R 


P Sem C T -> R 
P Sem T -> C 


假定 F 表 示 这 个 函数 依赖 的 集合 。 最 后 一 个 函数 依赖 是 重复 的 , 因此 我 们 从 集合 中 删除 它 。 
接着 ， 我 们 通过 消除 元 余 属 性 来 减少 左边 部 分 。 比 如 ， 为 检测 左边 的 部 分 St C Sem, 我 们 必须 
计算 几 个 属性 闭 包 : (St Sem)r = {St, Sem}; (St C)+ = {St,C};(C Sem) = {C,Sem}， 这 表明 在 
第 一 个 函数 依赖 中 没有 元 余 属 性 。 同 样 地 ，P Sem, C Sem T 和 P Sem T 也 不 能 被 减少 。 然 而 ， 
检测 P Sem C T 会 带 来 一 些 回报 : (P Sem T) =P Sem TCR， 因 此 C 可 以 被 删除 。 

上 述 分 析 得 到 如 下 的 函数 依赖 集 ， 我 们 加 上 编号 以 便 进行 索引 。 

FD 1: St C Sem -> P 

FD 2: P Sem -> C 

FD 3: C Sem T -> P 

FD 4: P Sem T -> C 

FD 5: P Sem T -> R 

下 一 阶段 是 去 除 元 余 国 数 依赖 ， 同 样 利 用 属性 集 闭 包 进 行 检测 。 由 于 (St C Sem) (rm 
=St C Sem, FD1 不 能 被 消除 。FD2、FD3、FD5 均 不 能 删除 。 然 而 ，FD4 是 宛 余 的 (由 于 FD2)， 
因此 它 可 以 被 消除 。 这 样 ， 最 小 覆盖 是 


St C Sem -> P 
P Sem -> C 

C Sem T -> P 
P Sem T -> R 


这 会 得 到 如 下 依赖 保持 的 3NF 分 解 : 


(St C Sem P; St C Sem -> P) 
(P Sem C; P Sem -> C) 

(C Sem T P; C Sem T -> P) 
(P Sem T R; P Sem T -> R) 





容易 验证 ， 上 述 模 式 没 有 一 个 会 组 成 原始 模式 的 一 个 超 键 ; 因此 ， 为 了 使 上 述 分 解 是 无 
损 的 ， 我 们 需要 加 一 个 模式 ， 它 的 属性 闭 包 包含 所 有 原始 属性 。 模 式 (St T Sem P;{)) 是 一 个 符 
合 要 求 的 属性 。 i 

如 果 你 相信 3NF 合 成 算法 是 正确 的 ， 并 且 我 们 在 应 用 它 时 没有 出 错 ， 那 么 没有 必要 再 对 
3NF 进 行 检测 。 然 而 ， 我 们 回顾 一 下 可 以 看 到 第 一 个 模式 和 第 三 个 模式 不 是 BCNF， 因 为 函数 
依赖 P Sem—> C 岁入 在 第 二 个 模式 中 。 

考虑 到 P Sem ~ C， 第 一 个 模式 的 进一步 分 解 产生 (P Sem C;P Sem > C) 和 (P Sem St;{}), 
这 是 一 个 无 损 分解 但 函数 依赖 St C Sem > P 没 有 保持 。 

考虑 到 P Sem > C， 第 三 个 模式 的 分 解 产生 (P Sem C;P Sem > CFIP Sem T;{})， 这 是 另 
一 个 无 损 分 解 ， 同 样 丢失 C Sem T > P. 

因此 ， 最 终 的 BCNF 分 解 是 


(P Sem C; P Sem 一 C) 

(P Sem St) 

(P Sem T) 

(P Sem T R; P Sem T > R) 
(St T Sem P) 


这 个 分 解 是 无 损 的 ， 因 为 我 们 首先 获得 了 一 个 无 损 的 3NF 分 解 ， 接 着 应 用 BCNEF 算 法 ， 它 
可 以 保持 无 损 性 。 然 而 ， 它 不 是 依赖 保持 的 ， 因 为 St C SemP 和 C Sem T~P 没 有 表示 在 上 述 
模式 中 。 


8.9 第 四 范式 
世界 上 所 有 的 问题 并 非 都 是 由 不 好 的 函数 依赖 引起 的 。 考 虑 如 下 模式 : 


PERSON(SSN, PhoneN, ChildSSN) (8.13) 


我 们 假定 一 个 人 可 以 有 几 个 电话 号 码 和 几 个 孩子 。 如 下 所 示 是 一 个 可 能 的 关系 实例 。 



















SSN PhoneN ChildSSN 

111-22-3333 516-123-4567 222-33-4444 

111-22-3333 516-345-6789 222-33-4444 

111-22-3333 516-123-4567 333-44-5555 

111-22-3333 516-345-6789 333-44-5555 (8.14) 
222-33-4444 212-987-6543 444-55-6666 

222-33-4444 212-987-1111 5655-66-7777 












222-33-4444 
222-33-4444 


212-987-6543 
212-987-1111 


555-66-7777 
444-55-6666 








由 于 没有 非 平 凡 的 函数 依赖 ， 所 以 这 个 模式 满足 3NF 也 满足 BCNE。 然 而 ， 很 明显 它 不 是 
一 个 好 的 设计 ， 因 为 它 有 相当 大 的 元 余 。 除 了 通过 SSN ， 电 话 号 码 和 孩子 之 间 没 有 特定 的 关 
联 ， 因 此 每 个 关联 于 给 定 SSN 的 ChildSSN 项 必须 与 每 个 关联 于 同一 个 SSN 的 PhoneN 出 现在 同 
一 个 元 组 中 。 因 此 ， 当 添加 或 删除 一 个 电话 号 码 时 候 ， 也 需要 添加 或 删除 几 个 元 组 。 如 果 一 
个 人 丢弃 所 有 电话 号 码 ， 则 关于 孩子 的 信息 也 将 会 丢失 (或 者 使 用 NULIL 值 )。 

这 里 似乎 可 以 使 用 压缩 技术 。 比 如 ， 我 们 可 以 决定 只 存储 一 些 元 组 ， 只 要 有 一 个 方法 可 
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以 重 构 原 始 信息 。 


111-22~3333 516-123-4567 222-33-4444 


111-22-3333 516-345-6789 333-44-5555 
222-33-4444 212-987-6543 444-55-6666 
222-33-4444 212-987-1111 555-66-7777 











尽管 它 更 有 效 ， 但 它 并 没有 解决 上 述 的 异常 。 而 且 ， 它 会 给 应 用 程序 加 上 一 些 额外 的 负 
担 ， 即 应 用 程序 必须 清楚 压缩 模式 。 

在 我 们 讨论 BCNF 时 ， 我 们 知道 当 属性 值 间 的 一 个 特定 的 语义 联系 的 存储 多 于 一 次 时 ， 就 
会 产生 元 余 。 对 图 5-2 来 说 ,一 个 人 的 SSN 为 111111111， 他 住 在 123 Main St. 就 是 一 个 例子 ， 
这 个 信息 被 存储 了 三 次 。 在 这 个 例子 中 ， 问 题 被 追溯 到 了 SSN 和 Address 之 间 的 函数 依赖 ， 而 
SSN 不 是 键 (因此 可 以 有 多 行 对 应 一 个 SSN 值 )。 然 而 ， 语 义 联系 的 元 余 存 储 并 不 仅 限于 此 。 
在 (8.14) 所 示 的 关系 r 中 ， 联 系 SSN-PhoneN 和 SSN-ChildSSN 被 存储 了 多 次 ， 但 这 里 并 没有 
涉及 函数 依赖 。 这 里 出 现 问题 是 因为 有 几 个 属性 (本 例 中 PhoneN 和 ChildSSN ) ， 它 们 的 值 的 
集合 与 另 一 个 属性 的 单 值 相关 联 (本 例 中 是 SSN ) 。 由 于 某 个 SSN 的 人 有 多 个 孩子 ， 所 以 特定 
的 SSN 值 和 特定 的 PhoneN 值 之 间 的 联系 被 存储 了 多 次 。 注 意 ， 这 个 联系 满足 如 下 性 质 : 

I = ISSN Phonen (T) D< Issn caitassn (T) (8.15) 

当 一 个 模式 的 所 有 合法 实例 都 要 求 满足 (8.15) 时 ， 这 个 性 质 被 称 为 联结 依赖 。 当 一 个 企 
业 的 特征 被 值 的 集合 所 描述 时 ， 就 会 引起 联结 依赖 。 用 E-R 方 法 进行 数据 库 设 计 ， 我 们 看 到 这 
样 的 特征 被 表示 为 集合 值 (set-valued) 属性 ， 并 且 把 它们 转换 为 关系 模式 中 的 属性 是 不 方便 
的 。 特 别 地 ， 当 一 个 实体 类 型 或 联系 类 型 有 几 个 集合 值 属性 ， 就 会 产生 联结 依赖 。 

条 件 (8.15) 看 起 来 应 该 比较 熟悉 。 它 保证 将 r 分 解 为 两 个 表 NtssN pronen (r) Assn chissu (r) 
时 是 无 损 的 。 本 例 当然 符合 这 个 要 求 ， 但 它 并 不 是 我 们 所 关心 的 。 这 个 条 件 还 告诉 我 们 一 些 r 
的 情况 : 一 个 联结 依赖 表明 语义 联系 的 存储 在 r 的 一 个 实例 中 会 有 宛 余 。 

从 形式 上 说 ，R 是 属性 集合 。 联 结 依赖 (Join Dependency, ID) 是 如 下 的 一 种 约束 : 

R= Rpg pa R, 

KP, Riv Rake 尺 的 一 个 分 解 。 回 忆 前 面 我 们 定义 的 关系 实例 满足 函数 依赖 的 定义 。 

我 们 现在 对 JP 定义 同样 的 概念 : 环 的 一 个 关系 实例 r 满 足 上 述 联结 依赖 的 条 件 为 ; 


r= As (r) Dd .bd Ni (T) 


设 R=( R ; Constraints) 是 一 个 关系 模式 ， 其 中 中 是 属性 的 集合 ，Constraints 是 FD 和 JD 的 集 
合 。 和 仅 有 FD 的 情况 一 样 ， 当 且 仅 当 它 满足 Constraints 中 所 有 约束 时 ， 属 性 集 下 的 一 个 关系 
是 R 的 一 个 合法 实例 。 

特别 应 该 关注 的 是 所 谓 的 二 元 (binary ) 联结 依赖 ， 也 称 为 多 值 依赖 (MultiValued 
Dependency, MVD). Efe R= Rio 下 的 JD。 关 系 模式 PERSON(8.13) 所 展现 的 元 余 
就 是 由 这 种 特定 的 联结 依赖 所 引起 的 。 第 四 范式 (在 [Fagin 1977] 中 引入 ) 被 用 来 防止 这 种 类 
型 的 元 余 。 
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MVD 对 关系 实例 的 约束 方式 与 FD 一 样 ， 因 此 一 个 关系 模式 的 描述 必须 包括 这 两 者 。 所 以 
我 们 可 以 描述 一 个 关系 模式 R 为 ( R; D)，D 是 FD 和 MVD 的 集合 。JD 蕴 涵 的 定义 与 FD 强 涵 的 定 
义 类 似 。 设 5 是 JD 的 集合 ( 可 能 有 FD )，d 是 一 个 JD( 或 FD)。 如 果 满 足 S 中 所 有 依赖 的 每 个 关系 
实例 r 同 样 满足 4， 那 么 5 玛 涵 d4。 在 下 一 节 ， 我 们 会 介绍 一 个 MVD 如 何 被 MVD 和 集合 所 蕴涵 。 一 
个 关系 模式 ，R=( R; D) 被 认为 是 第 四 范式 ， 如 果 对 每 个 被 D 蕴 涵 的 MVD R = Xx F, F 
面 两 个 条 件 中 的 一 个 为 真 : 

。XCY 或 YCX (MVD 是 平凡 的 ) 

°. XN Y ÆRE (XN 了) RRDAM) 

那么 关系 模式 R = ( R; D) 就 是 第 四 范式 (Fourth Normal Form, 4NF) 

容易 看 出 ，PERSON 不 是 一 个 4NF 模 式 ， 因 为 MVD Person={SSN PhoneN} ™ {SSN 
ChildSSN} 成 立 ， 而 SSN={SSN PhoneN} N {SSN ChildSSN} 不 是 超 键 。 这 里 直觉 会 告诉 我 们 什 
么 ? 如 果 SSN 是 一 个 超 键 ， 那 么 对 每 个 SSN 的 值 ， 最 多 只 有 一 个 PhoneN 的 值 和 一 个 ChildSSN 
的 值 ， 因 此 没有 元 余 。 

1. 4NF4eBCNF 

可 以 看 到 ， 满 足 4NF 模 式 同 样 满足 BCNF 模 式 ( 即 4NF 弥 补 了 BCNF 留 下 的 漏洞 )。 为 说 明 
这 一 点 ， 假 定 R=( R; D) 是 一 个 4NF 模 式 ， 叉 一 了 是 衣 中 成 立 的 一 个 非 平 几 函 数 依 赖 。 为 说 明 
4NF 模 式 同 样 是 BCNF 模 式 ， 我 们 必须 声明 是 R 的 超 键 。 为 简单 起 见 ， 假 定 邓 和 了 是 不 相交 
的 。 那 么 Ri= 总 过 ， 玉 2= 尺 -了 是 了 R 的 无 损 分 解 ， 利 用 8.6.1 节 的 二 元 模式 分 解 的 无 损 性 测试 
可 以 证 明 。 因 此 ，R = Ri Ot 尽 是 一 个 二 元 联结 依赖 ， 即 及 中 成 立 的 MVD。 但 根据 4NEFE 定 
义 ， 下 面 任 一 个 会 成 立 : XYCR-Y (不 可 能 ) MR-VY COCKY GRBRBR=XFMKXE 
超 键 ) 或 Rin R (=X) 是 超 键 。 这 意味 着 R 中 每 个 非 平凡 函数 依赖 满足 BCNF 的 需求 。 

同样 可 以 看 到 (但 更 难 做 到 )， 如 果 R=( 丸 ;D) 中 DD 只 包含 FD， 那 么 当 且 仅 当 R 是 BCNF 时 
R 是 4NF (参见 [Fagin 1977])。 换 句 话 说 , 在 (除了 FD) MVD 必 须 被 说 明 的 设计 环境 下 ， 
4NF 是 BCNF 需 求 的 一 个 扩展 。 

2. 设计 4NF 模 式 

因为 4NF 包 含 BCNF， 我 们 不 可 能 找到 一 个 通用 的 算法 ， 对 一 个 任意 的 关系 构造 一 个 依赖 
保持 且 无 损 的 4NF 分 解 。 和 BCNF 一 样 ， 无 损 分 解 为 4NF 总 是 可 以 达到 的 。 这 样 一 个 算法 与 
BCNF 的 算法 很 类 似 。 它 是 一 个 从 原始 模式 开始 的 一 个 迭代 过 程 ， 每 一 步 产 生 有 更 少 MVD 违 
背 4NF 的 一 个 分 解 : MURR E= Ra 记 ) 是 这 样 一 个 中 间 模 式 ，D; 蕴 涵 一 个 违背 4NF 的 MVD， 
REXY, KARAER RAIAR; Da) 和 ( 了; D;,)， 它 们 两 个 都 不 包含 那个 
MVD。 最 终 ， 将 不 会 留 下 和 任何 违背 4NF 要 求 的 MVD。 l 

关于 这 个 算法 有 两 个 要 点 要 强调 一 下 。 第 一 ， 如 果 R=( R; DID 是 一 个 模式 ， STED 
(为 简单 起 见 ， 假 定 5 和 了 工 不 相交 )， 那 么 这 个 FD 曾 涵 MVD Ri= 5 Tos (页 ;~ 五)。 这 样 ， 
4NF 分 解 算法 可 以 把 FD 看 作 MVD。 4NF 分 解 算法 中 另 一 个 不 太 明 显 的 问题 是 决定 分 解 中 成 立 
的 依赖 集 。 即 ， 如 果 根 据 MVD R= X eq FARRE Rs DP)， 在 分 解 的 结果 中 ， 哪 个 依赖 集 
RE XMF ERY? ERE TD) n (D;), a De FAT LORE. E DUD AHH 
包 ， 即 所 有 被 P 莉 涵 的 FED 和 MVD 的 集合 (8.1075 AMVDA MT — 7S HERE HOUSE). FDZE 
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属性 集 上 的 投影 在 8.6.2 节 已 经 定义 。 对 一 个 MVD， 尺 ;=Vm 下 属于 Dr， 它 的 投影 
Te(R=V OW )ELA X= XNV)S(XNW) (MRI WCX), SUCRE. iR 
容易 验证 对 MVD 来 说 ， 这 个 投影 规则 是 正确 的 (参见 练习 8.22 ) 。 

为 说 明 这 个 算法 ， 考 虑 一 个 模式 ， 其 属性 为 4BCD，MVD 为 4BCD=4BrpdaBCD， 
ABCD=ACD™BD, 486CD=4BCpDqBCD。 应 用 第 一 个 MVD ， 我 们 得 到 如 下 分 解 : ABBCD. $ 
余 MVD 在 4B 上 的 投影 未 定义 。 第 三 个 MVD 在 BCD 上 的 投影 是 BCD=BCpcdBCD， 这 是 一 个 平 
凡 MVD， 第 二 个 MVD 在 BCD 上 的 投影 是 BCD=CDm%mBD。 根 据 最 后 一 个 MVD， 我 们 可 以 分 解 
BCD 产 生 如 下 最 终结 果 : 4B,BD,CD。 注 意 ， 如 果 我 们 根据 第 三 个 MVD 首 先 分 解 4BCD， 最 终 
结果 将 变 为 4B,8C,8D,CD， 

4NF 的 设计 理论 并 不 像 3NF 和 BCNF 理 论 发 展 的 那么 好 ， 并 且 没 有 多 少 已 知 的 算法 。 一 般 
建议 读者 先 分 解 为 3NF， 接 着 根据 上 述 算法 进一步 分 解 不 好 的 ( 非 4NF) 模式 。 在 更 复杂 的 层 
次 上 ， 在 [Beeri and Kifer 1986a, 1986b, 1987] 中 有 论述 ， 它 们 开发 了 一 个 设计 理论 和 相应 的 算 
法 ， 通 过 合成 new(0 属 性 来 改正 设计 问题 。 这 些 高 级 问题 在 下 一 节 将 会 简要 论述 。 

3. 第 五 范式 

我 们 不 打算 在 本 书 中 讲述 第 五 范式 。 知 道 存在 第 五 范式 就 够 了 ， 数 据 库 设 计 者 通常 不 需 
要 关心 它 。5NF 与 4NF 类 似 ， 它 是 基于 联结 依赖 的 ， 但 不 像 4NF， 它 会 把 没有 被 超 键 蕴 涵 的 所 
有 非 平凡 JD( 不 止 是 二 元 的 ) 排 除 掉 。 . 


8.10 高 级 4NF 设 计 * 
8.9 节 提出 4NF 算 法 的 目的 是 使 你 熟悉 MVD 和 4NF, 但 它 只 是 4NF 设 计 过 程 的 开端 。 在 本 节 ， 
我 们 提供 一 些 更 有 深度 的 信息 ， 解 释 在 有 ED 和 MVD 的 情况 下 ， 设 计数 据 库 模 式 的 主要 困难 ， 


并 给 出 解决 的 方法 。 特 别 地 ， 我 们 会 解释 为 什么 4NEF 分 解 算法 并 没有 完全 解决 元 余 问题 ， 为 什 
么 在 有 MYVD 的 情况 下 BCNE 可 能 会 存在 某 些 不 足 。 有 关 的 更 多 细节 ， 你 可 以 查找 参考 文献 。 


8.10.1 MVD 和 它们 的 性 质 


多 值 依赖 是 二 元 联结 依赖 。 然 而 ， 和 通用 的 联结 依赖 不 同 ， 它 们 有 一 些 类 似 于 FD 的 好 的 
代数 性 质 。 特 别 地 ， 就 像 FD 有 Armstrong 公 理 一 样 ， 可 以 用 一 套 语 法 规则 从 给 定 的 MVD 集 合 
推导 出 新 的 MVD。 当 我 们 使 用 MVD 的 一 个 特定 符号 时 ,这些 规 则 的 形式 特别 简单 : 按照 惯例 ， 
对 关系 模式 R=( R; DHEU R= Vm W 的 多 值 依赖 表示 为 一 了， 其 中 谨 = 了 YN WA 
XUY=VRAXUY=W. Ab, X-PFRR=K YS X(R-Y) WANA. 

请 思考 一 下 这 个 概念 背后 所 隐藏 的 一 些 简单 结论 。 当 一 个 局 性 4 的 单 值 与 属性 8 的 一 个 值 
的 集合 ， 以 及 属性 C 的 一 个 值 的 集合 相关 联 时 ， 会 出 现 MVD。 包 含 在 镁 中 的 属性 4 可 以 看 作 
一 个 独立 的 变量 ， 它 的 值 决 定 ( 用 符号 一 表示 ) 关联 的 3 和 C 的 值 集合 ，B 和 C 一 个 包含 在 
中 ， 另 一 个 包含 在 叉 了 的 补 中 。 比 如 ，(8.13) 中 PERSON 关 系 的 MVD: SSN PhoneNSSN 
ChildSSN 可 以 表示 为 SSN -一 PhoneN 或 SSN >- ChildSSN。 

另外 ， 把 左边 相同 的 MVD 进 行 合并 是 比较 方便 的 。 例 如， 叉 一 了 和 宗 一 Z 可 表示 
为 了 一 了 1Z 。 很 容易 看 到 这 样 一 对 MVD 等 价 于 形 如 对 了 Mm X Zo X(R-Y Zz) 的 联结 依 
e RRA X 了 12 不 仅 对 推理 系统 是 方便 的 ， 同 样 可 以 表示 哪里 出 现 元 余 : 如 果 属 性 





乏 ， 节 ， 达 包含 在 一 个 关系 模式 中 ， 那 么 了 和 过 之 间 的 关联 很 可 能 会 被 元 余地 存储 。 我 们 
在 PERSON 关 系 的 语 境 下 看 到 了 这 个 问题 ， 后 面 还 会 对 它 进行 讨论 。 

使 用 这 个 符号 ， 我 们 现在 引入 一 个 推理 系统 ， 可 以 用 来 决定 FD 和 MVD 的 强 涵 。 这 个 扩展 
的 系统 包含 Armstrong 公 理 和 如 下 规则 。 

1. FD-MVD 合 成 

这 些 规则 混合 了 FD 和 MVD。 

。 复 制 (Replication): X> Y BwX- Y. 

。 结 合 (Coalescence): WRWCY MY N Z=, PAK~-YMZ- WAX- W. 

2. 仅 对 MVD 的 规则 

这 些 规则 有 些 类 似 于 FD 规则 ， 有 些 是 新 的 。 

。 自 有 反 性 (Reflexivity ): HEDRA, X> XRM. 

* 增 广 性 (Augmentation): X= Y mx Z~> Y. 

。 相 加 性 (Additivity): X> YX- ZBMX- Y Z. 

e #282 (Projectivity): X — YX- ZMK ~- YN ZIIX~Y-Z. 

。 传 递 性 (Transitivity): KX —- YMY ~ ZBwmX- Z-Y. 

*。 擅 传递 性 (Pseudotransitivity): X — YAY W — Zam X Wo Z-(Y WwW). 

e žħ (Complementation): X —— YAM X— R-XY, HH RBRACHARBHHES. 

这 些 规 则 首先 出 现在 [Beeri et al. 1977]; {H[Maier 1983] 就 这 个 主题 进行 了 更 系统 、 更 易 
理解 的 介绍 。 这 些 规则 是 正确 的 ， 对 任何 关系 ， 只 要 规则 前 提成 立 ， 规 则 的 结果 就 一 定 成 立 。 
例如 ， 像 对 无 损 性 一 样 ， 复 制 使 用 同样 的 推理 规则 : 如 果 X > Y, BARDRAR I= X Y 
Fl R= XR- YVER; AK R=X YM X(R-Y)NHAX>Y. 

然而 ， 一 个 显著 的 事实 是 给 定 一 个 包含 MVD 和 FD 的 集合 *， 以 及 可 以 是 FD 或 MVD 的 一 个 
依赖 4，s 当 且 仅 当 通过 对 6 中 依赖 的 上 述 规则 (加 上 Armstrong 公 理 ) 的 一 个 纯粹 的 句法 应 用 
可 以 推出 4。FD 一 个 类 似 的 性 质 之 前 称 为 完备 性 (completeness )。 证 明 上 述 推 导 规 则 的 正确 
性 是 一 个 不 错 的 练习 (参见 练习 8.21)。 完 备 性 则 更 难 证 明 。 有 兴趣 的 读者 可 以 参考 [Beeri et 
al. 1977, Maier 1983], 


8.10.2 设计 4NF 的 困难 性 


MVD 推 理 规则 是 十 分 有 用 的 ， 因 为 它们 有 助 于 消除 元 余 的 MVD 和 FD。 和 只 有 FD 的 情况 
一 样 ， 使 用 非 元 余 的 依赖 集 可 以 改善 前 面 描述 的 4NEF 分 解 算法 的 设计 。 然 而 ， 即 使 在 没有 元 
余 依 赖 的 情况 下 还 有 可 能 出 错 。 我 们 使 用 一 些 例 子 来 说 明 这 些 问题 。 考 虑 三 个 问题 : 依赖 丢 
失 、 元 余 、 使 用 FD 和 MVYD 进 行 设 计 。 

1. 一 个 合同 的 例子 

考虑 模式 

CONTRACTS (Buyer, Vendor, Product, Currency) 

其 中 ， 形 如 (John Doe, Acme, Paper Clips, USD) 的 元 组 表示 购买 者 John Doe 有 一 份 合同 ， 使 
用 美元 从 Acme 公 司 购买 纸 夹 。 假 定 我 们 的 关系 表示 购买 者 和 公司 之 间 的 一 个 国际 网 络 合同 。 
尽管 这 个 合同 使 用 美元 结算 ， 但 如 果 Acme 用 DM (德国 马克 ， 假 设 它 是 一 家 德国 公司 ) 销售 





P&S KHAKI: 关系 规范 化 理论 185 


它 的 一 些 产品 ， 那 么 把 这 个 合同 存储 为 两 个 元 组 也 许 更 方便 : 一 个 使 用 USD 表 示 的 金融 信息 ， 
另 一 个 使 用 DM。 通 常 ，CoNTRACTS 满 足 如 下 规则 : 如 果 一 个 公司 使 用 几 种 货币 结算 ， 那 么 每 
个 合同 均 用 一 个 元 组 描述 。 这 可 以 用 如 下 的 MVD 描 述 : 


Buyer Vendor —» Product | Currency (8.16) 


更 直接 地 ， 这 个 MVD 意 味 着 


CONTRACTS = (Buyer Vendor Product) eq (Buyer Vendor Currency) 


这 个 国际 网 络 的 第 二 个 规则 是 ， 如 果 两 个 供应 商 供应 一 种 特定 的 产品 和 接受 一 种 特定 的 
货币 ， 而 且 如 果 那 个 产品 的 购买 者 有 一 份 与 其 中 一 个 供应 商 签署 的 合同 来 买 特定 产品 ， 那 么 
这 个 购买 者 必须 与 男 一 个 供应 商 也 有 购买 该 种 产品 的 合同 。 例 如 ， 如 果 除 了 上 述 元 组 ， 
CoNTRACTS 包 含 (Mary Smith, OfficeMin, Paper Clips, USD), 那 么 它 必须 包含 元 组 (John Doe, 
OfficeMin, Paper Clips, USD) 和 (Mary Smith, Acme, Paper Clips, USD)。 这 种 类 型 的 约束 可 以 
使 用 如 下 MVD 表 示 : 


Product Currency —> Buyer | Vendor (8.17) 
让 我 们 试 着 用 4NF 分 解 算法 。 如 果 我 们 首先 用 依赖 (8.16) 进行 分 解 ， 得 到 如 下 无 损 分 解 : 
(Buyer, Vendor, Product) (8.18) 


(Buyer, Vendor, Currency) 

可 以 观察 到 ， 一 旦 这 个 分 解 完 成 ， 第 二 个 MVD 不 能 再 被 应 用 ， 因 为 在 上 述 两 个 模式 中 没 
有 联结 依赖 成 立 ?。 这 种 情况 非常 类 似 于 我 们 在 BCNF 分 解 算法 中 面临 的 问题 : 在 这 个 过 程 中 ， 
也 许 会 丢失 一 些 依赖 。 在 本 例 中 ， 可 能 丢失 的 是 依赖 (8.17)。 如 果 我 们 首先 使 用 上 面 的 第 二 

个 分 解 ， 会 有 同样 的 问题 ， 但 此 时 会 丢失 依赖 (8.16). 

和 在 BCNF 分 解 中 丢失 FD 不 同 ， 丢 失 MVD 是 一 个 潜在 的 更 严重 的 问题 ， 因 为 这 个 结果 可 
能 还 会 有 相当 的 元 余 ， 即 使 分 解 中 每 个 关系 都 是 4NE! 为 说 明 这 一 点 ， 考 虑 CoNTRACTS 模 式 的 
如 下 关系 : 


Product Currency 








C 


C 
C 
C 





容易 检测 出 这 个 关系 满足 MVD(8.16) 和 (8.17)。 例 如 ， 为 验证 (8.16)， 考 虑 对 分 解 模式 
(8.18) 进行 投影 。 


| Buyer Vendor Product | Buyer 








Vendor | Currency | 








By vy P By Vi C 
Bo Vp P By v c 
By v P Bi Vp C 
By v P By v c 





全 ”这 不 是 很 明显 ， 因 为 我 们 没有 讨论 验证 这 种 情况 的 合适 工具 。 然 而 ， 在 这 个 例子 中 ， 我 们 声明 ， 可 以 直接 
使 用 自然 联结 的 定义 进行 验证 。 我 们 建议 读者 参考 [Maier 1983] 这 本 优秀 的 参考 书 来 了 解 这 个 技术 。 
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联结 (使 用 自然 联结 ) 这 两 个 关系 显然 会 产生 CoONTRACTS 的 原始 关系 。 更 进一步 观察 可 以 
看 到 ， 上 述 关 系 仍 包含 相当 大 的 元 余 。 例 如 , 第 一 个 关系 两 次 说 明 产 品 P 由 供应 商 Vi 和 V: 供 应 。 
而 且 ， 该 关系 两 次 说 明 购 买 者 B: 和 B: 想 要 购买 P。 第 一 个 关系 似乎 要 求 进一步 分 解 为 (Buyer， 
Vendor) 和 (Vendor, Product)， 第 二 个 关系 要 求 分 解 为 (Buyer, Currency) 和 (Vendor, 
Currency)。 但 是 ， 这 两 个 要 求 都 不 能 满足 ， 因 为 没有 一 个 分 解 是 无 损 的 〈 比 如 ，Vendor 不 是 
第 一 个 关系 的 健 )。 结 果 是 ， 分 解 (8.18) 会 遇 到 同样 的 更 新 异常 ， 即 使 每 个 关系 都 满足 4NF! 
更 进一步 ， 由 于 4NF 包 含 BCNF， 在 有 MVD 的 情况 下 ， 即 使 BCNF 也 不 能 保证 完全 消除 元 余 。 

2. 一 个 词典 的 例子 

下 面 一 个 例子 考虑 多 语言 词典 关系 ，DICTIONARY(English, French, German)， 它 提供 从 一 
种 语言 到 另 一 种 的 转换 。 正 如 所 期 望 的 ， 每 个 术语 有 到 每 种 语言 的 一 个 翻译 (也 许多 于 一 个 )， 
并 且 这 些 翻 译 彼此 独立 。 使 用 MVD 很 容易 得 到 这 些 约束 。 


English —> French | German 
French —» English | German (8.19) 
German —> English | French 


和 上 面 一 样 ， 问 题 是 在 4NE 分 解 算法 中 应 用 任何 一 个 MVD 会 丢失 其 他 两 个 依赖 ， 分 解 结 
果 同 样 会 有 更 新 异常 。 

3. 一 个 多 语言 词典 例子 

让 我 们 扩展 前 面 的 例子 ， 以 使 一 个 术语 只 与 一 个 概念 关联 ， 每 个 概念 有 一 个 关联 的 描述 
(由 于 本 例 的 目的 ， 忽 略 描述 使 用 的 语言 ) 。 相 应 的 模式 成 为 DICTIONARY (Concept, 
Description, English, French, German), ， 其 依赖 是 

English 一 Concept 
French 一 Concept 
German 一 Concept | (8.20) 


Concept 一 Description 
Concept - English | French | German 


概念 的 一 个 例子 是 A5329， 带 有 描述 “homo sapiens” 和 翻译 {human, man}, {homme}, 
{Mensch, Mann}, 

4NF 分 解 算法 建议 我 们 从 挑选 一 个 违背 4NF 的 MVD 开 始 ， 在 分 解 过 程 中 使 用 它 。 由 于 每 
个 FD 同样 是 MVD， 我 们 可 以 先 选择 English > Concept， 它 会 产生 模式 (English, Concept) 和 
(English, French, German, Description)。 使 用 MVD 的 传递 性 规则 ， 我 们 可 以 推导 出 MVD 
English +> French | German | Description， 并 进一步 分 解 第 二 个 关系 为 (English， 
French),(English, German),(English, Description), 

最 终 的 模式 有 两 个 缺点 。 第 一 ， 它 倾向 于 English ， 而 原始 模式 是 完全 对 称 的 。 第 二 ， 双 
语 关系 中 的 每 一 个 关系 ， 比 如 (English, French) ， 会 元 余地 列 出 所 有 可 能 翻译 (从 English 到 
French， 或 从 French 到 English ) 。 例 如 ， 如 果 a 和 2 是 英语 的 同义词 ，c 和 d 是 法 语 的 同义词 ，a 
翻译 为 c， 那 么 英法 词典 (English, French) 有 所 有 四 个 元 组 : (a, c), (a, d), (b, OAD, d). 

使 用 4NF 分 解 算法 的 一 个 更 好 的 方法 是 ， 在 考虑 (8.20) 中 的 函数 依赖 下 ， 计 算 (8.20) 
中 MVD 的 左边 部 分 的 属性 闭 包 ， 根 据 增 广 规则 得 到 如 下 MVD: 
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Concept Description —> English | French | German 


我 们 可 以 使 用 这 个 MVD 来 应 用 4NF 分 解 算法 ， 这 会 产生 分 解 (Concept, Description, 
English)( Concept, Description, French)( Concept, Description, German)。 我 们 可 以 使 用 FD 进 一 
步 分 解 这 些 关系 为 BCNF， 产 生 (Concept, Description )。 我 们 不 但 把 它 分 解 为 4NF， 还 保持 了 
所 有 依赖 。 


8.10.3 如 何 进行 4NF 分 解 


上 述 例子 使 我 们 明白 ， 设 计 4NF 并 不 是 一 个 简单 的 过 程 。 实 际 上 ， 这 个 问题 直到 20 世 纪 
80 年 代 的 早期 一 直 是 一 个 活跃 的 研究 领域 [Beeri et al. 1978, Zaniolo and Melkanoff 1981, 
Sciore 1983]。 最 终 ， 所 有 这 些 工作 被 合并 为 [Beeri and Kifer 1986b] 中 一 个 统一 的 框架 。 我 们 
不 会 深入 研究 这 个 方法 的 细节 ， 它 的 要 点 可 以 用 我 们 的 三 个 例子 解释 : Ala. igh. BERR. 

1. 分 割 左边 的 异常 

当 一 个 MVD 拆 分 另 一 个 MVD 的 左边 部 分 时 ， 表 明 会 有 设计 问题 ， 正 如 合同 例子 所 示 的 那 
样 。 例 如 ，MVD(8.17) 划 分 (8.16) 中 左边 的 部 分 (Buyer, Vendor)， 这 表明 Buyer 和 Vendor 是 
不 相关 的 属性 (每 个 购买 者 与 每 个 供应 商 的 某 个 元 组 关联 )， 因 此 不 能 在 同一 个 关系 中 。 把 
CONTRACTS 关 系 分 解 为 (Buyer, Vendor, Product) 和 (Buyer, Vendor, Currency) SZFERA, 
也 是 这 个 原因 

这 个 模式 存在 问题 的 原因 也 许 是 不 正确 地 指定 了 依赖 。 不 使 用 CoNTRAcT 模 式 中 的 MVD ， 
联结 依赖 


Buyer Product p< Vendor Product 
oa Vendor Currency pq Buyer Currency 


似乎 更 合适 。 它 简单 地 说 明 每 个 购买 者 需要 特定 的 产品 ， 每 个 供应 商 供应 特定 的 产品 ， 一 个 
供应 商 可 以 接受 特定 的 货币 ， 一 个 购买 者 可 以 支付 特定 的 货币 。 只 要 一 个 购买 者 和 一 个 供应 
商 可 以 在 产品 和 货币 上 匹配 ， 一 个 交易 就 可 以 进行 。 这 个 英语 的 描述 与 合同 例子 描述 中 的 需 
求 相 匹配 ， 设 计 者 也 许 没 能 认识 到 上 述 JD 就 是 所 需 的 。 

2. RAR 

一 个 交 异 常 是 指 一 个 模式 有 一 对 MVD， 形 如 对 一 Z 和 站- ,但 没有 MVD XN YF =Z. 
注意 ， 我 们 的 词典 例子 就 包含 这 种 异常 : 有 MVD English 一 French 和 German 一 French， 但 是 
ii fe iO 一 French, [Beeri and Kifer 1986b] 认 为 这 是 一 个 设计 问题 ， 可 以 通过 创建 new(0) 
属性 来 修正 这 个 问题 。 在 这 里 ， 属 性 Concept 丢 失 了 。 事 实 上 ， 我 们 的 辞典 例子 就 是 基于 词典 
例子 ， 再 添加 这 个 特定 的 属性 9。 和 将 它 与 老 的 属性 关联 起 来 的 依赖 。 令 人 惊讶 的 是 ， 这 种 类 
型 的 异常 可 以 自动 改正 ， 即 新 的 属性 和 关联 的 依赖 可 以 用 一 个 良好 的 算法 来 产生 [Beeri and 
Kifer 1986a, 1987]. 

3. 设计 策略 

假定 拆 分 左边 的 部 分 不 会 产生 异常 8 ， 模 式 R=( R; D) 到 第 四 范式 的 一 个 依赖 保持 分 解 可 
以 利用 以 下 五 个 步骤 得 到 。 l 


O ” 另 一 个 属性 Description 用 来 说 明 另 一 个 问题 ， 这 里 暂时 先 不 考虑 它 。 
O 这 样 的 异常 意味 着 依赖 是 不 正确 或 不 完备 的 。 
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1) 使 用 被 D 疮 涵 的 FD， 计 算 每 个 MVDX 一 了 左边 的 属性 闭 包 XY。 用 X' 一 了 替换 X 一 了 。 

2) 找到 MVD 结 果 集 的 最 小 覆盖 。 如 果 D 并 不 存在 拆 分 左边 的 异常 ， 这 样 一 个 覆盖 是 唯 
一 的 。 
3) 通过 加 入 新 的 属性 ， 使 用 算法 [Beeri and Kifer 1986a, 1987] 消 除 交 异常 。 
4) 只 用 MVD 来 应 用 4NF 分 解 算 法 。 
5) 只 用 FD 在 每 个 结果 模式 中 应 用 BCNF 设 计算 法 。 
在 分 解 结果 中 每 个 关系 都 符合 4NF， 没 有 MVD 丢 失 ， 这 保证 在 结果 模式 中 没有 元 余 。 而 
且 ， 如 果 最 后 一 步 的 分 解 是 依赖 保持 的 ， 那 么 这 5 个 步 又 都 是 依赖 保持 的 。 

从 词典 例子 到 辞典 例子 的 转变 ， 以 及 辞典 例子 的 最 终 分 解 是 这 五 步 过 程 的 一 个 说 明 。 为 
了 简化 例子 ， 我 们 先 应 用 步 又 3，、 接 着 增加 一 个 属性 Description, 以 说 明 步 又 1 并 使 步骤 5 更 令 人 
感 兴趣 。 由 于 我 们 的 例子 没有 元 余 的 MVD ， 则 没有 必要 进行 步骤 2。 


8.11 范式 分 解 的 总 结 


我 们 总 结 一 下 讨论 过 的 范式 分 解 算法 的 一 些 性 质 。 
.第 三 范式 模式 也 许 会 有 一 些 元 余 。 我 们 讨论 的 产生 3NF 模 式 的 算法 是 无 损 且 依赖 保持 的 。 
它 不 考虑 多 值 依赖 

“如 果 只 考虑 FD， 那 么 Boyce-Codd 分 解 没 有 宛 余 。 我 们 讨论 的 产生 BCNF 模 式 的 算法 是 无 
损 的 ， 但 可 能 不 是 依赖 保持 的 。( 正如 我 们 已 看 到 的 ， 一 些 模式 并 没有 既是 无 损 又 依赖 
保持 的 Boyce-Codd 分 解 .) 它 并 不 考虑 多 值 依赖 ， 因 此 这 种 依赖 可 能 会 造成 元 余 。 

第 四 范式 分 解 没有 任何 非 平凡 的 多 值 依赖 。 我 们 讨论 的 产生 4NF 模 式 的 算法 是 无 损 的 ， 
但 可 能 不 是 依赖 保持 的 。 它 会 尝试 消除 与 MVD 关 联 的 元 余 ， 但 它 并 不 能 确保 所 有 这 样 
的 元 余 都 能 消除 。 

注意 ， 上 述 分 解 都 不 会 产生 拥有 我 们 想 要 的 所 有 属性 的 模式 。 


8.12 案例 研究 : 学 生 注册 系统 的 模式 精 化 


我 们 花费 了 很 大 的 精力 来 研究 关系 的 规范 化 理论 ， 我 们 现在 可 以 用 它 来 验证 5.7 节 设计 的 
学 生 注册 系统 。 好 消息 是 ， 把 图 5-14 中 的 E-R 图 转换 为 图 5-16 和 图 5-17 所 示 的 关系 这 一 步骤 ， 
我 们 完成 得 不 错 ， 因 此 大 部 分 关系 都 满足 Boyce-Codd 范 式 。 下 面 我 们 要 开始 新 的 工作 。 

为 确定 一 个 模式 是 否 符合 范式 ， 我 们 应 该 收集 所 有 相关 的 函数 依赖 。 一 个 来 源 是 
PRIMARY KEY 和 UNIQUE 约 束 。 然 而 ， 也 许 还 有 其 他 的 依赖 不 能 通过 这 些 约束 或 E-R 图 所 捕 
捉 到 。 只 能 通过 只 能 通过 仔细 地 检查 模式 和 应 用 程序 的 规格 说 明 来 发 现 这 些 依赖 。 如 果 没 有 
找到 新 的 依赖 ， 模 式 中 所 有 函数 依赖 都 是 主键 和 候选 键 (或 者 被 它们 药 涵 的 函数 依赖 )， 那 么 
这 个 模式 是 BCNF。 如 果 发 现 其 他 的 函数 依赖 ， 我 们 必须 检测 模式 是 否 符合 范式 要 求 ， 如 果 不 
符合 要 求 ， 就 要 进行 适当 的 调整 。 

在 我 们 的 例子 中 ， 我 们 可 以 验证 图 5-16 中 所 有 关系 模式 (除了 CLAss 之 外 ) 都 符合 BCNE， 
因为 它们 没有 函数 依赖 不 被 键 所 蕴涵 。 进 行 这 个 验证 并 不 是 很 困难 ， 因 为 这 些 模 式 有 6 个 或 更 
少 的 属性 。 困 难 的 是 验证 CLAss， 它 有 10 个 属性 。 
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我 们 使 用 CLAss 模 式 来 说 明 这 个 过 程 。 在 这 个 过 程 中 ， 我 们 发 现 一 个 丢失 的 函数 依赖 并 规 
范 化 CLAss。 首 先 ， 我们 列 出 为 那个 关系 在 CREATE TABLE 语 句 中 指定 的 键 约束 。 
1) CrsCode SectionNo Semester Year — ClassTime 
2) CrsCode SectionNo Semester Year 一 Textbook 
3) CrsCode SectionNo Semester Year 一 Enrollment 
4) CrsCode SectionNo Semester Year 一 MaxEnrollment 
5) CrsCode SectionNo Semester Year -> ClassroomlId 
6) CrsCode SectionNo Semester Year — InstructorId 
7) Semester Year ClassTime InstructorId —> CrsCode 
8) Semester Year ClassTime InstructorId ~> Textbook 
9) Semester Year ClassTime InstructorId —> SectionNo 
10) Semester Year ClassTime InstructorId — Enrollment 
11) Semester Year ClassTime InstructorId -> MaxEnrollment 
12) Semester Year ClassTime InstructorId + ClassroomId 
13) Semester Year ClassTime ClassroomId 一 CrsCode 
14) Semester Year ClassTime ClassroomId —> Textbook 
15) Semester Year ClassTime ClassroomId 一 SectionNo 
16) Semester Year ClassTime ClassroomId —> Enrollment 
17) Semester Year ClassTime ClassroomId —> MaxEnrollment 
18) Semester Year ClassTime ClassroomId — InstructorId 


验证 那些 大 的 模式 中 的 额外 依赖 是 很 困难 的 ， 因 为 必须 考虑 CLAss 属 性 的 不 是 超 键 的 每 个 
子 集 ， 并 检测 它 是否 销 数 决定 别 的 属性 。 这 个 “检测 ”并 不 是 基于 任何 具体 算法 。 严 格 地 说 ， 
确定 一 个 特定 的 FD 是 否 在 一 个 关系 中 成 立 ， 是 设计 者 在 用 数据 库 建 模 真实 世界 时 ， 对 相应 实 
体 的 语义 的 理解 问题 ， 本 质 上 它 是 容易 出 错 的 。 然 而 ， 现 在 已 经 开始 相应 的 研究 来 解决 这 个 
问题 。 比 如 ，FDEXPERT[Ram 1995] 是 一 个 专家 系统 ， 通 过 使 用 关于 典型 企业 的 知识 和 它们 
的 设计 模式 ， 可 以 帮助 数据 库 设计 者 发 现 FD。 

但 是 ,我 们 手边 并 没有 这 样 一 个 专家 系统 ， 因 此 我 们 分 析 起 来 很 费力 。 考 虑 如 下 的 候 
选 FD: i 

ClassTime ClassroomId InstructorId 一 CrsCode 

容易 看 出 为 什么 这 个 FD 并 不 适用 ， 因 为 不 同 的 课程 可 以 被 同一 个 老师 在 同一 个 时 间 同 一 
个 教室 教授 ， 只 要 所 有 这 些 在 不 同学 期 和 年 份 发 生 。 利 用 类 似 方法 ， 可 以 拒绝 许多 其 他 的 FD。. 
然而 ， 正 如 5.7 节 所 介绍 的 ， 我 们 假定 对 给 定 的 课程 ， 最 多 只 有 一 种 教材 ， 如 下 的 函数 依赖 是 
对 先前 指定 的 CLASS 约束 集 一 个 合适 的 补充 : 

CsrCode Semester Year 一 Textbook (8.21) 

尽管 某 门 课程 使 用 的 教材 每 学 期 都 可 以 不 同 ， 但 如 果 一 门 课程 在 一 个 特定 的 学 期 开设 ， 
因为 注册 人 数 太 多 会 被 分 为 几 个 班 , .那么 所 有 班 都 会 使 用 同样 的 教材 9 。 

现在 容易 看 出 CLAss 的 设计 问题 : 上 述 依赖 的 左边 部 分 不 是 键 ，Textbook 不 属于 任何 键 。 
因此 ，Crass 不 符合 3NF。3NF 合 成 算法 建议 ， 按 如 下 方法 划分 原始 模式 可 以 纠正 这 个 情况 : 


O 当然 ， 这 个 规则 不 一 定 适合 所 有 的 大 学 ， 但 对 大 部 分 大 学 来 说 都 为 真 。 
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。CLASS1 ， 包 含 所 有 CLAss 的 属性 (除了 Textbook 之 外 )， 以 及 ED 1,3~7,9~13,15~18 (这 些 

数字 指 前 面 提供 的 带 编号 的 FD 列表 )。 

e TEXTBOOKS (CrsCode, Semester, Year, TextBook), 以 及 一 个 FD CrsCode Semester 

Year ~ Textbook. 

XESS RG BIRT A BCNF, RAE EAA FD Ey be ee) RAR mS 
证 。3NF 合 成 算法 同样 保证 上 述 分 解 是 无 损 的 ， 并 且 是 依赖 保持 的 。 

让 我 们 考虑 一 个 更 实际 的 情况 ， 课 程 可 以 有 多 种 推荐 教材 ， 在 一 个 特定 学 期 的 课程 的 所 
有 班级 使 用 这 些 课本 。 在 这 种 情况 下 ，FD(8.21) 并 不 成 立 。 注 意 ， 任 何 特定 班级 使 用 的 教材 
与 上 课时 间 、 老 师 、 注 册 等 等 无 关 。 这 种 情况 类 似 于 8.9 节 的 (8.14) 所 示 的 PERsoN 关 系 ， 其 
中 ， 属 性 Textbook 与 属性 ClassTime、InstructorId 等 等 无 关 ， 上 述 情形 可 以 形式 地 表示 为 如 下 
的 多 值 依赖 : 


(CrsCode Semester Year Textbook) 
pq (CrsCode Semester Year ClassTime SectionNo 
InstructorId Enrollment MaxEnrollment ClassroomId) 


或 使 用 8.10 节 介绍 的 符号 表示 为 : 

CrsCode Semester Year —» Textbook 

和 PERSON 关 系 的 模式 一 样 ，CLASS 符 合 BCNF。 尽 管 这 样 ， 由 于 上 面 提 到 的 多 值 依赖 ， 它 
包含 元 余 。 解 决 这 个 问题 的 一 个 方法 是 使 用 更 高 层 的 范式 4NF， 幸 运 的 是 ， 使 用 8.10 节 的 算法 
很 容易 。 我 们 只 是 需要 使 用 上 述 依赖 分 解 CrAss ， 这 会 产生 如 下 无 损 分 解 (8.10 节 的 分 解 算法 
保证 了 无 损 性 ): 

e CLass1(CrsCode, Semester, Year, ClassTime, SectionNo, InstructorId, Enrollment, 

MaxEnrollment, Classroom1d) 和 函数 依赖 1,3~7,9~13,15~18。 

e TEXTBOOKS(CrsCode, Semester, Year, Textbook) 没 有 FD。 

注意 ， 这 个 模式 和 先前 在 每 个 班级 一 种 教材 的 假设 下 获得 的 模式 的 唯一 区 别 是 在 第 二 个 
模式 中 缺少 FD。 

CrsCode Semester Year 一 Textbook 

对 5.7 节 开发 的 学 生 注 册 系 统 的 初始 设计 应 用 关系 规范 化 理论 的 结果 是 产生 一 个 无 损 分 解 ， 
且 每 个 关系 都 符合 4NF (因此 也 符合 BCNF)。 幸 运 的 是 ， 这 个 分 解 是 依赖 保持 的 ， 因 为 为 模 
式 指定 的 每 个 FD 在 分 解 中 是 修 入 在 某 个 关系 中 的 ， 这 对 带 有 4NF 和 BCNF 的 设计 来 说 并 不 是 总 
可 以 达到 的 。 


8.13 性 能 调整 问题 : 是 否 进行 分 解 


在 本 章 ， 我 们 学 到 了 很 多 模式 分 解 的 理论 。 然 而 ， 这 个 理论 的 动机 是 在 数据 库 频繁 更 新 
的 情况 下 ， 避 免 元 余 会 导致 的 一 致 性 维护 问题 。 如 果 大 部 分 事务 是 只 读 查 询 会 怎么 样 ? 模式 
分 解 似乎 使 回答 查询 更 困难 ， 因 为 原本 存在 于 一 个 关系 中 的 关联 也 会 被 分 为 几 个 不 同 的 关系 。 
例如 ， 找 到 每 个 地 址 的 平均 爱好 数 ， 使 用 图 5-2 的 单一 关系 比 使 用 图 8-1 的 一 对 关系 更 加 有 
效 ， 因 为 后 者 要 求 在 计算 聚合 前 先进 行 联结 。 这 是 经 典 的 时 空 折 中 的 例子 ， 即 增加 元 余 可 以 
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改善 查询 性 能 。 如 果 对 一 个 特定 应 用 的 一 个 频繁 执行 的 查询 性 能 不 是 很 好 ， 就 必须 评估 是 否 
要 进行 这 样 的 折 中 。 在 这 种 情况 下 ， 术 语 反 规范 化 (denormalization ) 描述 了 这 种 情形 : 满足 
特定 的 范式 会 带 来 性 能 的 下 降 ， 因 此 不 应 该 进行 分 解 。 

通常 ， 没 有 一 种 建议 会 适合 所 有 情况 。 有 时 ， 模 拟 可 以 帮助 我 们 解决 问题 。 下 面 是 一 个 
有 冲突 指导 的 不 完全 列表 ， 对 每 个 特定 事务 的 混合 情况 需要 进行 评估 。 

1) 分 解 通常 会 使 回答 复杂 查询 的 效率 更 低 ， 因 为 在 评估 查询 时 要 执行 额外 的 联结 。 

2) 分 解 使 回答 简单 的 查询 更 有 效 ， 因 为 这 类 查询 通常 涉及 同一 关系 的 很 少 几 个 属性 。 因 
为 分 解 后 的 关系 有 更 少 的 元 组 ， 所 以 在 计算 简单 查询 的 过 程 中 需要 扫描 的 元 组 可 能 会 更 少 。 

3) 分 解 通常 使 简单 的 更 新 事务 效率 更 高 。 然 而 ， 对 复杂 的 更 新 事务 也 许 并 非 如 此 (如 给 
教 计算 机 村 学 专业 每 门 课程 的 所 有 教授 涨 工资 ) ， 因 为 它们 也 许 包 含 复杂 的 查询 (因此 也 要 求 
复杂 的 联结 ) 。 

4) 分 解 可 以 降低 对 存储 空间 的 要 求 ， 因 为 它 通常 会 消除 元 余数 据 。 

5) 如 果 元 余 程 度 低 的 话 ， 分 解 会 增加 存储 需求 。 例 如 ， 在 (8.14) 的 PERsoN 关 系 中 ， 假 
定 (有 很 少 例外 ) 大 部 分 人 只 有 一 个 电话 号 码 和 一 个 孩子 。 这 时 ， 模 式 分 解 通常 会 增加 存储 
需求 而 不 会 带 来 看 得 到 的 好 处 。 对 图 8-6 的 HAsSAccoUNT 进 行 分 解 ， 会 增加 更 新 事务 的 开销 。 
原因 是 对 FD 的 验证 


ClientId OfficeId.— AccountNumber 


在 更 新 后 要 求 进行 联结 ， 因为 属性 ClientId 和 OfficeId 属 于 分 解 中 不 同 的 关系 。 
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现在 [Beeri and Bernstein 1979] 中 。 对 无 损 分 解 的 一 个 通用 测试 方法 首先 出 现在 [Beeri et al. 1981] 中 。 合 
成 第 三 范式 的 的 算法 出 现在 [Bernstein 1976] 中 。 

第 四 范式 在 [Fagin 1977] 介 绍 , 该 书 同时 提出 了 一 个 朴素 分 解 算法 并 探索 了 4NF 和 BCNF 之 间 的 关系 。 
第 五 范式 在 [Beeri et al. 1977] 中 介绍 ， 但 我 们 推荐 参考 [Maier 1983] 来 系统 地 了 解 这 个 主题 。[Kanellakis 
1990] 的 综述 同样 是 一 个 好 的 起 点 。 关 于 4NF 的 其 他 论文 有 [Beeri et al. 1978, Zaniolo and Melkanoff 1981, 
Sciore 1983]。 最 后 ， 在 有 FD 和 MVD 时 设计 4NF 模 式 的 所 有 工作 被 扩展 并 集成 在 一 个 [Beeri and Kifer 
1986a and 1986b, 1987] 介 绍 的 统一 的 框架 中 。 关于 4NF 最 新 的 著作 有 [Vincent and Srinivasan 1993, 
Vincent 1999], 

本 书 提 供 的 深入 介绍 关系 设计 理论 的 教材 有 [Mannila and Raäihä 1992, Atzeni and Antonellis 1993}. 

正如 8.12 节 所 介绍 的 ， 应 用 本 章 讨论 的 结果 到 数据 库 设 计 的 最 大 的 障碍 是 ， 找 到 在 模式 规范 化 过 程 
中 使 用 的 正确 依赖 集 。 我 们 提 到 了 FDEXPERT 系 统 [Ram 1995]， 它 可 以 应 用 各 种 企业 的 知识 来 发 现 函 数 
依赖 。 在 使 用 机 器 学 习 和 数据 挖 据 技 术 来 发 现 FD、MVD 和 包含 依赖 的 算法 的 领域 ， 也 进行 了 大 量 的 研 
究 工作 [Huhtala et al. 1999, Kantola et al. 1992, Mannila and Railihi 1994, Flach and Savnik 1999, Savnik 
and Flach 1993]。 我 们 将 在 第 19 章 介绍 数据 挖掘。 
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8.15 练习 


8.1 


8.2 
8.3 
8.4 


8.5 
8.6 


8.7 


*8.8 


8.9 


8.10 


8.11 


8.17 


函数 依赖 的 定义 并 没有 排除 左边 部 分 为 空 的 情形 ， 即 它 允 许 使 用 形 如 {} -~ 4 的 FP。 解释 这 种 依赖 
的 含义 。 

给 出 一 个 例子 ， 说明 一 个 模式 不 是 3NF 但 只 有 两 个 属性 。 

一 个 关系 键 可 以 有 的 最 小 属性 个 数 为 多 少 ? 

一 个 表 4BC 有 属性 4,8,C 和 函数 依赖 A 一 BC。 写 一 个 SQL CREATE ASSERTION 语 名 以 防止 违背 这 
个 函数 依赖 。 

证 明 只 有 两 个 属性 的 3NF 关 系 模式 都 符合 BCNF。 证 明 最 多 只 有 一 个 非 平 几 FD 的 模式 符合 BCNF。 
证 明 Armstrong 传 递 性 公理 是 正确 的 ， 即 一 个 关系 若 满 足 FD X-Y, Y-Z, We BFD 
X-Z. 

证 明 如 下 的 通用 传递 性 规则 : 如 果 ZCY, WAX- Y, Z- WAX- W. Ree 
方法 证 明 这 条 规则 : 

。 直接 使 用 FD 定义 的 方法 ， 如 8.4 节 所 示 。 

* 试 用 Armstrong 公 理 ， 通 过 一 系列 的 步骤 ， 从 叉 - 阅 ，Z ~ WESHX-W. 

我 们 已 经 证 明了 图 8-3 算 法 的 的 正确 性 ， 即 如 果 4 E closure, M A EX 。 证 明 这 个 算法 的 完整 性 。 
即 如 果 ACX; ， 那 么 在 计算 结束 时 4 E closure。 提 示 : 利用 Armstrong 公 理 ， 对 推导 X-~ 4 的 长 度 
进行 归纳 。 

BR=(R; 站 是 一 个 关系 模式 ，Ri=( Ri F), e, R= (Ras F,) 是 它 的 分 解 。r 是 R 的 一 个 有 效 关 
系 实例 ， T= Xi (7)。 证 明 ri 福 足 FD 的 集合 F,， 且 是 模式 R 的 一 个 有 效 关 系 实例 。 

it 下 .和 不: 是 属性 的 集合 ， 尺 = RU Ro re 及 的 关系 。 证明 Tr Crs (r) my (r)。 将 这 个 
结果 推广 到 下 分解 为 *>2 的 模式 。 

设 R=( R; ) 是 一 个 模式 ，Ri=( Ris Fi), Rel, Ro 9) 是 一 个 二 元 分 解 ，( 慷 1n Ra RR 
(Rin R2)~ 玉 : 均 不 被 F 缆 涵 。 构 造 一 个 关系 r， 使 FrC nagl) ng (r), “C” RRIHTE. 
设 R, ，…， 有 ,是 模式 R 的 分 解 ， 它 通过 一 系列 二 元 无 损 分 解 得 到 (以 R 的 一 个 分 解 开始 ) 。 证 明 
R11，-…，R, 是 模式 R 的 无 损 分 解 。 

证 明 图 8-8 的 BCNF 分 解 算 法 的 循环 有 如 下 性 质 : 每 个 下 一 次 迭代 的 数据 库 模式 比 上 一 次 迭代 的 模 
式 有 严格 更 少 的 违背 BCNF 的 FD。 

证 明 8.8 节 的 合成 3NF 分 解 的 算法 产生 的 模式 满足 3NF 条 件 (提示 : 使 用 反 证 法 。 假 定 一 些 FD 违 
背 3NF， 接 着 证 明 这 与 用 最 小 覆盖 合成 的 模式 的 算法 相 矛 盾 )。 

考虑 数据 库 模 式 ， 它 的 属性 为 4、B、C、D、E， 函 数 依赖 为 BE，E-A，A4-D， D~E. 证 明 
这 个 模式 分 解 为 48，BCD，ADE 是 无 损 的 。 它 是 依赖 保持 的 吗 ? 

考虑 关系 模式 ， 它 的 属性 为 A4BCGWXYZ， 依赖 集 为 F={XZ-2ZYB, YA~CG, C-W, B-G, 
XZ G}。 使 用 合适 的 算法 解决 如 下 问题 。 

a. 找到 F 的 最 小 覆盖 。 

b. 依赖 XZA - 73 是否 被 F 蓝 涵 ? 

c. 分 解 为 XZYA4B 和 YABCGW 是 无 损 的 吗 ? 

d. 上 述 分 解 是 依赖 保持 的 吗 ? 

考虑 属性 集 4BCDEFGE 的 如 下 函数 依赖 : 
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ATE 

AD > BE 

AC> E 

E-B 

BG>F 

BE~D 

BDH~E 

FoA 

D-H 

CD-A 

找到 最 小 覆盖 ， 接 着 分 解 为 无 损 的 3NF。 完 成 后 ， 检 查 结果 关系 是 否 符合 BCNF。 如 果 找 到 一 个 

模式 不 是 BCNF， 把 它 分 解 为 无 损 的 BCNF。 解 释 所 有 步骤 。 

找到 如 下 依赖 集 在 属性 4FE 上 的 投影 : 

A>BC 

C> FG 

E = HG 

G>A . 

考虑 模式 ， 其 属性 集 为 4BCDEFH， 函 数 依赖 在 (8.12) 中 描述 。 证 明 分 解 (4D; A> D), (CE, C>E), 

(FA, F> A), (EF; E> F), (BHE; BH EE) 不 是 无 损 的 ， 通 过 对 ABCDEFH 一 个 具体 的 关系 实例 在 这 

个 模式 上 的 投影 来 展现 信息 的 丢失 。 

BBM BCDFGHA RP FD:BG~CD, G>F, CD~GH, C>FG, F-D, 使 用 3NF 合 成 算法 来 

获得 3NF 的 一 个 无 损 的 、 依 赖 保持 的 分 解 。 如 果菜 个 结果 模式 不 是 BCNF ， 继 续 分 解 它们 为 

BCNF, 

证 明 8.10 节 所 有 FD 和 MVD 的 推理 规则 是 正确 的 。 换 句 话 说， 对 每 个 关 率 r， 满 足 对 有 R 的 任何 规则 

的 假设 中 的 依赖 ，R 的 结论 同样 被 r 满 足 ( 即 ， 对 于 增 广 律 ， 证 明 如 果 X 一 了 在 r 中 成 立 ， 那 

AX 世 一 了 同样 在 r 中 成 立 )。 l 

tX., Y. 5. REMESA, ASCRMXUYE=R. grë ROTA, RIE 

MVD R= XXY ( XRY ORAWHHTH). 

a. 证明; MMR XN YCS, WARR n) 满足 MVD $= Sn XS NF). 

biz X. Y. S. RMRLMMARE (除了 天 了 天 了 之 外 )。 给 出 的 一 个 例子 ,满足 
R=X™Y, 但 不 满足 5=(S n YS NnF). 

考虑 关系 模式 ， 它 有 属性 4BCDEFG 和 如 下 MVD: 

ABCD ™ DEFG 

CD x ABCEFG 

DFG :qd ABCDEG 

找到 一 个 到 4NF 的 无 损 分 解 。 

对 属性 集 4BCDEFG，MVD 是 

ABCD ^ DEFG 

ABCE bq ABDFG 

ABD ™ CDEFG 
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找到 一 个 到 4NEF 的 无 损 分 解 。 它 是 唯一 的 吗 ? 

考虑 R 的 一 个 分 解 R…R,， 它 是 通过 3NF 合 成 算法 的 步骤 1、2、3 得 到 的 〈 除 了 步 又 4)。 假 定 R 中 
有 一 个 属性 4 不 属于 任何 Ri, i = 1,…,n。 证 明 A 必 须 是 R 的 每 个 键 的 一 部 分 。 

考虑 通过 3NF 合 成 得 到 的 RR 的 分 解 Ri,…R.。 假 定 R; 不 符合 BCNF，X- A 是 R 的 一 个 违规 的 FPD。 证 
明 R; 中 一 定 有 另 一 个 FD: 7- 五， 如 果 R, 根 据 X~ 4 进一步 分 解 的 话 ， 它 将 会 丢失 。 

这 个 练习 依赖 于 8.10 节 介绍 的 技术 。 考 虑 关系 模式 ， 它 的 属性 为 48CDEFGHI， 并 有 如 下 MVD 和 
FD: 

D-AH 

Gol 

D—- BC 

CB 

G —— ABCE 

找到 一 个 到 4NE 的 无 损 且 依赖 保持 的 分 解 。 





第 9 章 触发 器 和 动态 数据 库 


第 4 章 讨 论 的 是 如 何在 数据 库 反 应 性 约束 情况 下 使 用 触发 器 。 除 此 之 外 ， 触 发 器 还 有 其 他 
的 用 途 ， 例 如 在 需要 动态 数据 库 (active database) 的 应 用 中 会 经 常 看 到 触发 器 ， 这 些 应 用 必 
须 响应 各 种 外 部 事件 。 在 这 些 应 用 中 ， 对 可 能 出 现 的 外 部 事件 只 知道 总 体 情况 ， 却 不 知道 它 
们 的 确切 时 间 安 排 ， 触 发 器 特别 适合 这 种 情形 。 

虽然 触发 器 不 是 SQL-92 标 准 的 一 部 分 ， 但 是 许多 数据 库 厂商 都 会 在 各 自 的 产品 中 包括 茶 
种 形式 的 触发 器 。 本 章 所 讨论 的 触发 器 是 SQL:1999 标 准 的 一 部 分 ， 关 于 SQL:1999 中 触发 器 的 
更 多 信息 可 以 参考 [Gulutzan and Pelzer 1999], 


9.1 触发 器 处 理 的 语义 
触发 器 (trigger) 是 数据 库 模 式 的 元 素 之 一 ， 其 结构 如 下 所 示 : 


ON event IF precondition THEN. action ， 

其 中 event 是 执行 某 个 数据 库 操作 的 请 求 〈 例 如 在 一 张 学 生 课程 注册 表 中 播 和 人 一行) ; 
Precondifion 是 一 个 判定 结果 为 真 或 假 的 表达 式 〈 例 如 某 个 班 的 学 生 人 数 已 满 ) ; action 是 描 
述 当 事件 发 生 并 且 前 提 条 件 为 真 时 的 行为 的 语句 (例如 从 数据 库 删除 一 些 内 容 或 者 向 管理 员 
发 送 e-mail)。 因 为 触发 器 是 在 以 上 三 个 因素 的 基础 上 构建 的 ， 所 以 有 了 时 也 被 称 作 ECA 
(Event-Condition-Action) 规则 。 

令 人 惊奇 的 是 ， 在 这 个 简单 的 概念 后 面 隐藏 着 许多 复杂 的 问题 。 首 先 可 能 有 不 同类 型 的 
触发 器 ， 而 每 种 类 型 的 触发 器 可 以 用 在 不 同 的 应 用 中 。 其 次 ， 怎 样 以 及 什么 时 候 使 用 触发 器 
存在 许多 细微 的 差别 。 第 三 ， 在 某 个 时 间 点 可 能 会 同时 激活 若干 个 触发 器 ，DBMS 如 何 决定 
执行 哪 一 个 触发 器 并 按照 什么 样 的 顺序 执行 ? 不 同 的 选择 会 导致 不 同 的 执行 结果 。 

最 后 ， 执 行 触发 器 可 能 会 激活 其 他 的 触发 器 ， 因 此 一 个 事件 会 引起 一 连 串 触发 器 动作 ， 
并 且 不 能 确保 这 个 过 程 什么 时 候 会 停止 。 实 际 上 ， 每 个 DBMS 会 限制 链 式 反应 的 深度 。 例 如 ， 
如 果 深 度 超过 32， 那 么 抛 出 异常 停止 链 式 反应 ， 同 时 回 退 先 前 的 更 新 语句 和 触发 器 所 作 的 修 
改 。 发 生 链 式 反应 通常 说 明 设计 有 问题 ， 应 当 避 免 依赖 于 DBMS 所 施加 的 限制 。 在 本 章 的 后 
面 将 会 讨论 一 些 防止 链 式 反应 的 方法 。 

1. 触发 器 判断 

请 求 触发 事件 时 会 激活 (activated) 触发 器 ， 之 后 需要 检查 前 提 条 件 ， 触 发 器 要 判断 什么 
时 候 检 查 这 些 条 件 。 假 设 在 请 求 触发 事件 的 时 候 判 断 前 提 条 件 为 真 ， 从 而 执行 触发 器 。 但 是 
不 久之 后 ， 由 于 自身 或 者 其 他 事务 进行 更 新 操作 会 使 前 提 条 件 变 为 假 。 因 此 如 果 没 有 立即 检 
查 前 提 条 件 ， 那 么 就 有 可 能 不 会 执行 触发 器 。 

下 面 这 个 触发 器 的 目的 是 保证 注册 的 学 生 人 数 不 会 超过 课程 的 名 额 限制 : 
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ON inserting a row in course registration table 
IF over course capacity 
THEN abort registration transaction 


当 学 生 试 图 在 课程 注册 表 中 添加 自己 名 字 的 时 候 ， 课 程 名 额 可 能 已 满 。 所 以 如 果 前 提 条 件 在 
试图 注册 的 时 候 检 查 ， 那 么 会 拒绝 这 个 学 生 的 请 求 。 但 是 ， 与 此 同时 可 能 会 有 另外 一 个 学 生 
执行 放弃 课程 的 事务 (或 者 注册 人 员 增 加 课程 的 学 生 名 额 )， 并 且 第 二 个 事务 是 在 第 一 个 事务 
之 前 提交 。 因 此 如 果 触 发 器 前 提 条 件 是 在 提交 注册 事务 的 时 候 检查 ， 而 不 是 在 事件 发 生 的 时 
候 检查 ， 那 么 学 生 将 会 成 功 地 注册 这 门 课程 。 那 么 ， 在 本 例 中 延迟 判断 触发 器 前 提 条 件 的 策 
略 是 恰当 的 。 

但 是 ， 如 果 数 据 库 正在 监视 核电 厂 ， 触 发 事件 是 压力 增加 ， 前 提 条 件 为 压力 不 能 超过 某 
个 临界 值 ， 那 么 最 好 立即 判断 触发 器 的 前 提 条 件 。 

总 的 来 说 至 少 有 两 种 实用 的 策略 : 当 请 求 触发 事件 的 时 候 立 即 判断 ， 或 者 延迟 到 提交 事 
务 的 时 候 才 判断 。 

事实 上 ， 和 触发 器 判断 还 有 一 些 细节 需要 考虑 。 假 设 触发 器 7 是 由 事件 e 激 活 ， 涉 及 关系 尺 ， 
C 是 与 5 有关 的 条 件 。 在 许多 系统 中 (包括 SQL:1999 ) ，C 可 以 考虑 在 e 发 生 之 前 和 之 后 R 的 状 
态 。 因 此 ， 如 果 C 仅 使 用 R 的 两 个 状态 而 不 涉及 数据 库 中 的 其 他 关系 ， 那 么 立即 和 延迟 判断 触 
发 器 7 的 结果 是 相同 的 。 如 果 C 仅 考虑 之 前 R 的 状态 ， 那 么 这 可 以 解释 为 在 e 发 生 之 前 判断 C。 
但 是 如 果 C 涉 及 数据 库 关系 而 不 是 R， 那 么 两 种 判断 模式 的 结果 可 能 会 不 相同 。 

2. 触发 器 执行 

如 果 触 发 器 判断 被 推迟 ， 那 么 也 必须 将 触发 器 执行 推迟 到 触发 事务 的 结束 为 止 。 如 果 是 
立即 判断 ， 那 么 至 少 有 两 个 选择 ， 一 是 在 判断 后 立即 执行 触发 器 ， 二 是 将 执行 推迟 到 触发 事 
务 结束 后 。 对 于 原子 能 反应 堆 ， 立 即 执行 是 最 佳 选 择 ， 但 是 在 一 些 不 太 重要 的 情况 下 推迟 执 
行 是 比较 好 的 选择 。 l o. 

在 立即 执行 模式 下 有 三 种 可 能 ， 既 可 以 在 触发 事件 之 前 或 者 之 后 执行 ， 也 可 以 在 忽略 触 
发 事件 的 情况 下 执行 。 初 看 起 来 ， 有 两 种 情况 似乎 很 奇怪 ， 怎 么 可 能 在 事件 之 前 或 者 忽略 的 
情况 下 执行 动作 ? 原因 在 于 事件 是 一 个 由 事务 向 DBMS 发 出 的 请 求 ， 因 此 很 有 可 能 DBMS 忽 略 
请 求 而 执行 触发 器 ， 或 者 系统 先 执行 触发 器 然后 执行 请 求 的 动作 。 

3. 触发 器 粒度 

这 里 是 指 事件 的 组 成 。 行 级 粒度 (row-level granularity) 将 对 一 行 的 修改 看 作 一 个 事件 ， 
对 不 同行 的 修改 被 视 为 不 同 的 事件 ， 会 引起 触发 器 的 多 次 执行 。 相 反 、 语 旬 级 粒度 
(statement-level granularity) 将 事件 看 作 一 些 语句 ， 例 如 INSERT、DELETE 和 UPDATE, 而 
不 是 每 行 的 修改 。 因 此 一 个 没有 进行 修改 的 UPDATE 语 句 (因为 WHERE 子 名 的 条 件 没有 影响 
数据 库 中 的 记录 ) 也 是 引起 触发 器 执行 的 事件 。 

在 行 级 粒度 上 ， 触 发 器 需要 知道 受 影响 的 记录 的 原 值 和 新 值 ， 这 样 才 能 正确 判断 前 提 条 
件 。 例 如 增加 工资 ， 原 来 的 记录 包含 原来 的 薪水 ， 新 的 记录 包含 新 的 薪水 。 如 果 两 者 都 可 以 
得 到 ， 那 么 触发 器 可 以 确认 增长 幅度 没有 超过 10% 并 正确 地 执行 相应 的 动作 。 行 级 粒度 的 触 
发 器 可 以 通过 特殊 的 变量 访问 受到 影响 的 元 组 的 原 值 和 新 值 。 

在 语句 级 粒度 上 ， 更 新 放 在 诸如 原 表 和 新 表 这 样 的 临时 结构 里 。 这 样 允许 触发 器 查询 这 
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两 张 表 并 在 结果 的 基础 上 执行 操作 。 

4. 触发 器 冲突 

一 个 事件 可 能 会 一 次 激活 若干 个 触发 器 。 例 如 ， 当 学 生 注册 课程 的 时 候 将 触发 下 面 这 两 
个 触发 器 : 

ON inserting a row in course registration table 


iF over course capacity 
THEN notify registrar about unmet demands 


ON inserting a row in course registration table 
IF over course capacity 
THEN put on waiting list 


这 时 首先 考虑 哪 一 个 触发 器 呢 ? 有 两 种 方案 : 
。 顺序 原则 即 依次 判断 触发 器 的 前 提 条 件 。 如 果 条 件 为 真 ， 那 么 就 执行 相应 的 触发 器 。 
当 执行 完成 以 后 ， 再 考虑 下 一 个 触发 器 。 在 这 个 例子 中 ， 学 生 可 以 选择 接受 另 一 门 课程 
而 放弃 请 求 已 满员 的 课程 。 这 样 在 判断 第 二 个 触发 器 的 时 候 ， 因 为 前 提 条 件 不 再 为 真 ， 
因此 不 会 执行 。 
。 组 原则 也 就 是 一 次 判定 触发 器 的 所 有 前 提 条 件 ， 然 后 安排 执行 前 提 条 件 为 真 的 触发 器 。 
在 本 例 中 会 执行 (依次 或 者 同时 ) 所 有 的 触发 器 ， 即 使 某 些 触发 器 的 前 提 条 件 在 判定 后 
不 和 久 变 为 假 。 
对 第 一 种 方案 ， 系 统 可 以 决定 顺序 选择 或 者 随机 选择 触发 器 。 第 二 种 方案 中 的 顺序 无 关 紧 机， 
因为 可 以 安排 同时 运行 所 有 的 触发 器 (虽然 大 部 分 DBMS 仍 会 排序 )。 
5. 触发 器 和 完整 性 约束 
第 4 章 讨 论 过 更 新 数据 库 可 能 会 违反 参照 完整 性 约束 。SQL 可 以 指定 修正 动作 (例如 ON 
DELETE CASCADE), 使 DBMS 借 此 恢复 完整 性 。 这 些 动作 可 以 看 作 是 特殊 的 具有 严格 语义 
的 触发 器 : 在 执行 结束 时 ， 必 须 恢 复数 据 库 的 完整 性 。 如 果 修 正 动作 激活 了 其 他 会 引发 违反 
参照 完整 性 的 触发 器 ， 那 么 情况 会 变 得 比较 复杂 。 这 时 必须 以 最 终 恢复 完整 性 约束 为 目标 安 
排 所 有 的 触发 器 。 目 前 还 没有 一 个 明确 的 方案 可 以 解决 触发 器 安排 问题 。 本 章 后 面 的 部 分 将 
讨论 SQL:1999 是 如 何 解决 这 个 问题 的 。 


9.2 SQL:1999 中 的 触发 器 ， 


制定 SQL:1999 当 前 的 触发 器 语法 和 语义 标准 经 历 了 一 个 相当 漫长 和 痛苦 的 过 程 。 首 先 ， 
各 个 数据 库 厂商 在 自己 的 系统 中 都 已 配备 了 触发 器 ， 因 此 标准 要 能 带 来 巨大 的 利益 才能 说 服 
厂商 改变 他 们 的 实现 。 其 次 ， 正 如 已 经 看 到 的 ， 与 触发 器 相关 的 语义 问题 并 非 无 足 轻 重 ， 除 
非 为 先前 提 到 的 问题 提供 良好 的 处 理 方案 ， 否 则 不 会 接受 这 个 标准 。 

对 与 触发 器 处 理 有 关 的 问题 有 了 全 新 的 认识 之 后 ， 现 在 开始 系统 地 探讨 SQL:1999， 

。 触 发 事件 ”事件 可 以 是 将 SQL INSERT、DELETE 和 UPDATE 语 句 作 为 一 个 整体 执行 ， 

或 者 是 利用 这 些 语句 对 单个 记录 进行 修改 。 

。 触 发 器 前 提 条 件 SQL 的 WHERE 子 句 中 允许 使 用 的 任何 条 件 。 

。 触 发 器 动作 ”可 以 是 SQL 查询 ，DELETE、INSERT、UPDATE、ROLLBACK 以 及 





SIGNAL 语 句 ， 或 者 是 使 用 SQL/PSM (SQL’s Persistent Stored Module, SQL AFF HE 
H) 语言 编写 的 程序 。SQL/APSM 使 过 程控 制 语 名 和 SQL 查询 与 更 新 语句 无 颖 地 集成 起 来 。 
有 关内 容 将 在 下 一 章 讨 论 。 

“触发 器 冲突 解决 ”按照 顺序 原则 ，SQL:1999 将 所 有 的 触发 器 进行 排序 ， 然 后 按照 某 个 特 

定 实 现 方式 执行 。 因 为 顺序 可 能 因数 据 库 产品 而 异 ， 所 以 必须 使 数据 库 产品 与 触发 器 的 
顺序 无 关 。 

"触发 器 判断 立即 判断 模式 ， 可 以 指定 在 触发 事件 之 前 还 是 之 后 执行 。 

“触发 器 粒度 支持 行 级 和 语句 级 两 种 模式 。 

下 面 是 SQL:1999 中 触发 器 的 完整 语法 。 方 框 号 里 的 结构 是 可 选 的 ; 而 花 括号 包含 若干 个 
由 坚 线 分 隔 的 选项 ， 需 要 指定 其 中 一 个 选项 : 

CREATE TRIGGER trigger-name 

{BEFORE | AFTER} 
{INSERT | DELETE | UPDATE [ OF column-name-list }} 
ON table-name 
[ REFERENCING[ OLD AS var-to-refer-to-old-tuple ] 
[ NEW AS var-to-refer-to-new-tuple ] ] 
{ OLD TABLE AS name-to-refer-to-old-table ] ] 
[ NEW TABLE AS name-to-refer-to-new-table ] J 
[ FOREACH { ROW | STATEMENT } j 
[ WHEN (precondition) } 
statement-list 
SQL:1999 触 发 器 的 语法 与 前 面 讨论 的 模型 大 致 相同 。 触 发 器 有 一 个 名 称 ; 它 由 某 个 事件 激活 
(INSERT-DELETE-UPDATE 子 句 指定 ) ; 可 以 定义 为 BEFORE 类 型 或 者 AFTER 类 型 (表明 是 
在 事件 之 前 还 是 在 事件 之 后 检查 前 提 条 件 ) ; WHEN 子 句 指定 前 提 条 件 。 子 句 FOR EACH 
ROW 和 FOR EACH STATEMENT 指 定 触发 器 的 粒度 。 如 果 指 定 前 者 ， 那么 该 触发 器 监视 的 表 
中 元 组 的 修改 会 激活 触发 器 ; 如 果 指 定 后 者 (默认 设置 )， 那 么 在 对 被 监视 的 表 每 次 执行 
INSERT、DELETE 或 者 UPDATE 话 名 的 时 候 都 会 激活 触发 器 ， 不 管 这 个 执行 会 修改 多 少 元 组 
(即使 没有 修改 也 会 激活 触发 器 )。 

WHEN 子 句 后 的 statement-1ist 定 义 触发 器 触发 时 执行 的 动作 ， 通 常 这 些 动作 是 SQL 语句 
《插入 、 删 除 或 者 更 新 记录 )， 但 是 更 一 般 的 形式 是 SQL/PSM 语 句 ， 它 将 SQL 语句 和 ift-then- 
else、 循 环 和 局 部 变量 等 融合 在 一 起 。 有 关 SQL/PSM 的 内 容 在 下 一 章 将 讨论 。 

REFERENCING 子 句 引 用 关系 Iable name 更 新 前 和 更 新 后 的 内 容 ， 可 以 用 在 WHEN 条 件 和 
紧 随 其 后 的 语句 列表 中 。 

有 两 种 类 型 的 引用 ， 这 与 触发 器 的 粒度 有 关 。 如 果 触 发 器 是 行 级 的 ， 那 么 可 以 使 用 OLD 
AS 和 NEW AS 子 句 定义 元 组 变量 来 引用 激活 触发 器 元 组 的 原 值 与 新 值 。 如 果 事 件 是 INSERT， 
”那么 不 能 用 OLD; 如 果 事 件 是 DELETE， 那 么 不 能 用 NEW。 如 果 触 发 器 粒度 是 语句 级 的 ， 那 
么 SQL:1999 提 供 一 些 方法 访问 触发 语句 所 影响 的 表 的 原 值 和 新 值 。OLD TABLE 命 名 一 张 含 
有 更 新 所 影响 的 元 组 的 原 值 的 表 ， 而 NEW TABLE 命 名 一 张 可 以 访问 这 些 元 组 的 新 值 的 表 。 


注意 NEW AS 和 OLD AS 定义 的 元 组 变量 仅仅 涉及 更 新 所 影响 的 行 。 也 就 是 说 ， 在 
村 入 元 组 的 时 候 ，NEW AS 指向 插入 的 元 组 ; 在 更 新 的 时 候 它 指向 被 更 新 元 组 的 新 状 





RIF BRERASKER 199 


A, OLD AS 指向 被 删除 的 元 组 或 者 被 更 新 元 组 的 原状 态 。 

同样 ，OLD TABLE 和 NEW TABLE 仅 仅 涉 及 更 新 所 影响 的 行 ， 而 不 是 整 张 表 的 原状 

态 和 新 状态 。 如 果 r 是 表 更 新 前 的 状态 ， 那 么 更 新 后 的 状态 是 (r- 旧 表 ) U 新 表 。 

最 后 ，SQL:1999 对 BEFORE 和 AFTER 触发 器 行为 可 以 施加 某 些 约束 。 

1. BEFORE 触 发 器 

所 有 BEFORE 类 型 的 触发 器 完全 在 触发 事件 发 生前 执行 。 它 们 不 能 更 新 数据 库 ， 但 是 可 
以 检查 WHEN 子 句 中 的 前 提 条 件 并 选择 接受 或 者 中 止 触发 事务 。 因 为 BEFORE 触 发 器 不 能 更 
新 数据 库 ， 因 此 也 不 能 激活 其 他 触发 器 。 

BEFORE 触 发 器 的 一 个 典型 用 途 是 保持 与 应 用 相关 的 数据 完整 性 。 例 如， 除了 已 经 熟悉 
的 TRANSCRIPT 表 外 ， 另 外 一 张 表 CRSLIMITS 具 有 字段 CrsCode、Semester 和 Limit (从 名 称 可 以 
看 出 每 个 字段 的 含义 )。 在 下 面 的 示例 中 ， 触 发 器 对 TRANSCRIPT 的 插入 操作 进行 监视 。 
INSERT 语 句 可 以 播 人 不 同 课程 的 多 条 记录 。 触 发 器 指定 行 级 粒度 ， 因 此 每 个 插入 被 视 为 单独 
的 事件 。 触 发 器 检查 插入 所 影响 的 课程 没有 超过 名 额 限制 。 如 果 超 过 ， 那 么 拒绝 插入 。 


CREATE TRIGGER ROOMCAPACITYCHECK 
BEFORE INSERT ON TRANSCRIPT 
REFERENCING NEW AS N 
FOR EACH ROW 
WHEN 
((SELECT COUNT(T.StudId) FROM TRANSCRIPT T 
WHERE T.CrsCode = N.CrsCode AND T.Semester = N.Semester) 
>= 
(SELECT L.Limit FROM CRSLIMITS L 
WHERE L.CrsCode = N.CrsCode AND L.Semester = N.Semester)) 
ROLLBACK 


注意 ，WHEN 子 句 中 的 第 一 个 SQL 语句 同时 引用 TRANSCRIPT 表 的 新 行 〈 通 过 行 变量 N) 和 
所 有 行 (通过 变量 T)。 在 检查 WHEN 条 件 的 有 效 性 时 TRANSscRIPT 表 的 状态 是 怎样 的 ? 对 于 N 所 
引用 的 行 ， 答 案 很 清楚 : 必须 是 所 引用 行 的 新 状态 。 但 对 于 T 所 引用 的 状态 ， 则 并 非 那么 显 而 
易 见 ， 答 案 是 ，BEFORE 触 发 器 认为 所 引用 的 表 处 于 原状 态 ， 而 AFTER 触发 器 则 认为 该 表 处 
于 新 状态 。 

2. AFTER 触发 器 

AFTER 触 发 器 完全 在 触发 事件 对 数据 库 进行 修改 以 后 执行 。 由 于 允许 它们 修改 数据 库 ， 因 
此 能 激活 其 他 触发 器 (这 会 引起 前 面 所 说 的 链 式 反应 )。AFTER 触 发 器 可 以 作为 应 用 逻辑 的 延伸 ， 
可 以 自动 处 理 各 种 事件 ， 从 而 减轻 应 用 程序 员 在 每 个 应 用 中 编写 处 理 这 些 事件 的 代码 的 负担 。 

下 面 的 示例 说 明 如 何 使 用 AFTER 触 发 器 。 首 先 来 看 一 下 怎样 执行 约束 : 事务 所 执行 的 薪 
水 增幅 不 得 超过 5%。 假 定数 据 库 有 一 张 具 有 属性 Salary 的 表 EMPLOYEE: 


CREATE TRIGGER LIMITSALARYRAISE 
l AFTER UPDATE OF Salary ON EMPLOYEE 
REFERENCING OLD AS 0 
NEWAS N 
FOR EACH ROW 
WHEN (N.Salary 一 0.Salary > 0.05 * 0.Salary) 
UPDATE EMPLOYEE 
SET Salary = 1.05 * 0.Salary 
WHERE Id = 0.IQ 
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当 更 新 EMPLOYEE 表 中 某 行 的 Salary 的 时 候 ， 触 发 器 通知 DBMS 比 较 原 值 和 新 值 。 如 果 增 幅 超 出 
所 设置 的 界限 ， 那 么 调整 薪水 增幅 为 5 多 。 如 果 增 幅 没 有 超出 所 设置 的 界限 或 者 薪水 下 降 ， 那 
么 不 会 执行 触发 器 。 注 意 ， 行 变量 O 和 N 始 终 引 用 同一 行 ， 即 数据 库 更 新 所 影响 的 那 一 行 。 不 
同 之 处 在 于 O 指 向 行 的 原状 态 而 N 指 向 行 的 新 状态 。 
注意 ， 当 触发 器 LIMITSALARYRAISE 被 触发 ， 并 执行 动作 的 时 候 ， 该 动作 会 覆盖 原来 事件 
(触发 LIMITSALARYRAISE) 的 影响 。 另 外 ， 动 作 本 身 是 一 个 触发 事件 ， 但 是 这 个 新 事件 不 会 导 
致 链 式 反应 : 当 第 二 次 检查 触发 器 的 时 候 ， 薪 水 实际 上 下 降 了 (正好 比 原来 的 薪水 增加 5% ) ， 
因此 WHEN 的 条 件 为 假 ， 触 发 器 不 会 再 执行 。 
目前 所 举 的 示例 中 的 触发 器 的 粒度 都 是 行 级 的 ， 但 是 有 一 些 应 用 要 求 在 完成 所 有 的 更 新 
后 触发 器 只 执行 一 次 。 下 面 举 两 个 示例 说 明 如 何 使 用 语句 级 的 触发 器 。 
假设 在 全 体 增加 薪水 之 后 想 记 录 所 有 员工 新 的 平均 薪水 ， 可 以 使 用 触发 器 实现 这 个 功能 : 
CREATE TRIGGER RECORDNEWAVERAGE 
AFTER UPDATE OF Salary ON EMPLOYEE 
FOR EACH STATEMENT 
INSERT INTO Loc 


VALUES (CURRENT_DATE, 
(SELECT AVG (Salary) FROM EMPLOYEE) ) 


当 触 发 器 执行 的 时 候 ， 会 在 Log 表 中 插入 一 行 记 录 新 的 平均 薪水 。 这 条 记录 同时 含有 计算 
平均 薪水 的 日 期 (CURRENT_DATE 是 返回 当前 日 期 的 一 个 内 嵌 函 数 )。 因 为 每 修改 一 行 记 录 
就 计算 一 次 平均 值 没 有 任何 意义 ， 所 以 使 用 语句 级 粒度 比 行 级 粒度 更 适合 。 

第 二 个 示例 说 明 语句 级 的 触发 器 如 何 维护 包含 依赖 (inclusion dependency )。 在 第 4 章 里 介 
绍 过 利用 包含 依赖 对 外 键 约束 进行 泛 化 ， 在 实际 中 会 经 常 使 用 这 样 的 设置 。 考 虑 下 面 的 依赖 : 
教师 去 教授 没有 学 生 注册 的 课程 ( 见 (4.1D) )。 这 是 一 个 不 基于 外 键 的 参照 完整 性 约束 ，SQL-92 
要 求 使 用 断言 来 表示 它 〈( 见 (4.4) )， 那 么 AFTER 触发 器 是 如 何 维护 更 新 时 的 约束 呢 e? 

关键 的 一 点 是 构建 SQL 视图 IpLETEACHING， 该 视图 包含 TEAacHING 表 中 那些 在 TRANSCRIPT 表 
中 没有 相应 记录 的 行 。 换 句 话说， 该 视图 包含 那些 违反 包含 依赖 的 行 。 定义 这 个 视图 的 工作 
留 给 大 家 作为 练习 。 

触发 器 的 工作 过 程 如 下 所 示 : 在 学 生 放 弃 某 门 课程 ( 某 些 课程 ) 后 ， 触 发 器 从 TEACHING 
表 中 删除 所 有 能 在 IDLETEACHING 发 现 的 行 。 


CREATE TRIGGER MAINTAINCOURSESNONEMPTY 
AFTER DELETE,UPDATE OF CrsCode,Semester ON TRANSCRIPT 
FOR EACH STATEMENT 
DELETE FROM TEACHING 
WHERE . (9.1) 
EXISTS (SELECT * 
FROM IDLETEACHING T 
WHERE Semester = T.Semester 
AND CrsCode = T.CrsCode) 


同样 ， 我 们 可 以 构建 触发 器 以 便 在 插入 记录 到 TEAcHING 表 中 时 维护 包含 依赖 。 如 果 在 
TRANSCRIPT 表 中 没有 相应 的 记录 ， 那 么 触发 器 将 中 止 试图 插入 记录 到 TEAcHING 表 中 的 事务 。 
AS 


日” 可 以 使 用 同样 的 方法 在 与 SQL-92 不 匹配 的 系统 中 仿效 外 键 约束 里 的 ON DELETE 和 ON UPDATE F4, 
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注意 ， 上 面 的 触发 器 也 许 会 引起 类 似 于 鸡 生 蛋 还 是 蛋 生 鸡 的 问题 。 直 到 某 个 学 生 注册 一 
门 课程 之 后 才能 给 这 门 课 程 安排 某 个 教师 。 但 是 大 部 分 学 校 下 学 期 的 课程 表 在 学 生 注册 之 前 
就 已 经 公布 了 ， 因 此 一 些 触发 器 需要 创建 并 销毁 。 例 如 上 面 的 触发 器 只 需要 在 注册 截止 时 间 
和 课程 增删 截止 时 间 之 间 有 效 即 可 。 

3. 触发 器 评价 过 程 概述 

假设 事件 e 在 执行 语句 S 的 时 候 发 生 。 ， 这 个 事件 激活 一 组 触发 器 T = {Ti, … To. FEE 
触发 器 处 理 的 过 程 : 

1) 将 新 激活 的 触发 器 放 入 触发 器 队列 Q 中 。 

2) 暂停 执行 5。 

3) 如 果 使 用 行 级 粒度 ， 则 计算 OLD 和 NEW; 如 果 使 用 语句 级 粒度 ， 则 计算 OLD TABLE 
和 NEW TABLE, 

4) 判断 T 中 所 有 BEFORE 触 发 器 ， 执 行 前 提 条 件 为 真 的 触发 器 ， 而 将 前 提 条 件 为 真 的 
AFTER 触发 器 放 入 Q 中 。 

5) 根据 S$ 更 新 数据 库 。 

6) 按照 优先 权 (依赖 于 实现 ) 判断 Q 中 的 每 个 AFTER 触发 器 ， 如 果 触 发 条 件 为 真 则 立即 
执行 。 如 果 触 发 器 执行 激活 了 新 的 触发 器 ， 那 么 跳 至 步 难 1 重新 执行 算法 ， 

7) 恢复 语句 $ 的 执行 。 

4. 触发 器 和 外 键 约 束 

当 激 活 触发 器 的 事件 是 在 一 个 具有 ON DELETE 和 ON UPDATE 外 键 约束 的 关系 上 发 生 的 
时 候 ， 这 些 子 名 指定 的 修正 动作 可 能 会 引起 自身 的 更 新 ， 从 而 使 系统 的 准确 语义 变 得 相当 复 
杂 。 实 际 上 ，SQL:1999 标 准 的 设计 者 需要 反复 多 次 进行 迭代 以 寻求 满意 的 解决 方案 。 

也 许 有 人 会 问 为 什么 不 能 将 外 键 约 束 看 作 通常 的 触发 器 呢 ? 实际 上 在 第 4 章 我 们 就 是 这 
样 称呼 它们 的 。 管 案 是 ， 这 些 约束 是 触发 器 ， 但 是 它们 具有 特殊 的 语义 (它们 是 为 了 修正 违 
反 外 刍 约 束 的 状态 ) ， 在 触发 器 评价 过 程 中 需要 包括 这 个 语义 。 为 了 达到 这 个 目的 ， 我 们 修 
RS: 

5) 根据 $ 更 新 数据 库 ， 对 每 一 个 当前 状态 所 违反 的 外 键 约束 执行 下 列 操作 : 

a) 将 相关 的 修正 动作 表示 为 act (也 就 是 CASCADE、 SET DEFAULT, SET NULL 或 者 
NO ACTION)。 注 意 ，act 是 一 个 事件 ， 可 能 会 激活 其 他 的 触发 器 S = {51, … , 5,}。 
b) 判断 S$ 中 的 所 有 触发 器 ， 执 行 前 提 条 件 为 真 的 BEFORE 触 发 器 ， 将 前 提 条 件 为 真 的 

AFTER 触发 器 放 入 Q 中 。 
c) 根据 act 更 新 数据 库 。 

注意 ,第 5' 步 中 的 c 并 没有 指明 将 S 中 未 处 理 的 触发 器 放 在 Q 的 队 首 还 是 队 尾 ， 因 为 SQL 是 
根据 优先 级 处 理 触发 器 的 。 

在 步 又 6 中 执行 AFTER 触发 器 可 能 会 激活 其 他 的 触发 器 ， 也 可 能 会 违反 外 键 约 束 ， 这 时 候 
循环 执行 步骤 1 ~ 6。 


O 回忆 一 下 ， 事 件 是 一 个 执行 数据 库 操作 的 请 求 。 





5. 示例 

上 面 的 算法 用 来 处 理 触发 器 和 外 键 约束 之 间 非常 复杂 的 交互 ， 这 个 交互 也 许 涉及 几 十 个 
触发 器 。 下 面 所 给 的 示例 是 比较 简单 的 ， 只 涉及 两 个 触发 器 和 一 个 外 键 约束 。 

假设 TRANSCRIPT 表 中 的 课程 也 必须 在 CouRsE 表 中 列 出 ， 这 两 张 表 已 在 图 4-4 中 描述 过 。 这 
两 个 表 之 间 的 外 键 约束 CHECKCOURSEVALIDITY 可 以 表示 如 下 : 


CREATE TABLE TRANSCRIPT ( 
StudId INTEGER, 
CrsCode CHAR(6), 
Semester CHAR(6), 
Grade grades, 
PRIMARY KEY (StudId, CrsCode, Semester), 
CONSTRAINT CHECKCOURSEVALIDITY 
FOREIGN KEY (CrsCode) REFERENCES Course (CrsCode) 
ON DELETE CASCADE 
ON UPDATE CASCADE ) 
如 果 CouRsE 的 记录 被 删除 或 者 更 新 ， 那 么 CHECKCoURSEVALIDITY 会 删除 或 者 更 新 所 有 对 
应 的 TRANSCRIPT 的 记录 。 
假设 有 一 个 AFTER 触 发 器 WATCHCOURSEHISTORY 记 录 CouRsE 表 中 元 组 的 变化 。 如 何 使 用 
SQL 定 义 这 个 触发 器 留 作 练习 。 最 后 ， 触 发 器 MAINTAINCOURSESNONEMPTY(9.1) 也 是 数据 库 模 
式 的 一 部 分 。 注 意 ， 这 个 示例 没有 考虑 其 他 外 键 约束 ( 特别 是 与 TEAcHING 相 关 的 外 键 约束 ， 
因为 包含 这 样 的 约束 会 使 情况 变 得 相当 复杂 )。 
现在 假设 CoursE 表 中 的 一 些 课程 发 生变 化 ， 例 如 2000 秋 季 开 设 的 CS305 变 成 CS405。 这 个 
变化 会 沿 活 触发 器 WATCHCOURSEHIsTORY 和 外 键 约束 CHECKCOURSEVALIDITY。 因 为 
WATCHCOURSEHISTORY 是 AFTER 触 发 器 ， 所 以 它 被 放 入 Q。 触 发 器 处 理 算法 首先 按照 步 又 5' 中 c 
处 理 外 键 约束 ， 因 此 TRANSCRIPT 表 中 所 有 CS305 的 记录 变 成 CS405。 
这 个 修改 激活 了 第 二 个 触发 器 MAINTAINCOURSESNONEMPTY。 因 为 CS305 已 经 变 为 CS405 ， 
这 样 教授 CS305 的 教师 无 课 可 上 。、 换 名 话说 ，CS305 在 TEACHING 表 中 ， 但 是 TRANSCRIPT 表 中 没 
有 相应 的 行 ， 因 此 MAINTAINCOURSESNONEMPTY 和 的 WHEN 条 件 为 真 ， 触 发 器 被 执行 。 
因为 MAINTAINCOURSESNONEMPTY 是 一 个 AFTER 触发 器 ， 所 以 被 放 在 Q 中 (步骤 $ 的 b)，Q 
中 已 经 包含 WATCHCOURSEHISTORY。 两 个 触发 器 执行 的 顺序 跟 所 用 的 DBMS 有 关 ， 因 而 无 法 预 
me. 当 所 有 的 触发 器 最 终 执 行 完毕 的 时 候 ， 课程 的 变化 被 记录 在 历史 日 志 中 而 CS305 的 课程 
安排 也 被 删除 。 
注意 ， 以 上 两 个 触发 器 和 外 键 约束 的 交互 也 许 不 能 产生 预想 的 结果 。 例 如 将 CS305 的 课程 
安排 变 成 CS405 的 安排 也 许 更 合理 些 。 


9.3 避免 链 式 反应 


在 触发 器 执行 中 出 现 永远 没有 结束 的 链 式 反应 是 一 个 十 分 严重 的 问题 。 在 任何 情况 下 触 
发 都 会 最 终 停止 的 触发 器 系统 称 为 是 安全 的 safe) AGE. 


O 大 部 分 DBMS 使 用 调度 策略 基于 反映 触发 器 判断 时 间 的 时 间 蕉 。 在 本 例 中 ， 时 间 蕉 顺序 应 该 先是 


WATCHCOURSEHISTORY 。 
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但 是 ， 没 有 算法 能 够 告诉 你 给 定 的 一 组 触发 器 是 否 是 安全 的 。 但 是 存在 一 些 充分 条 件 能 
够 保证 安全 性 〈 也 就 是 说 如 果 条 件 满 足 ， 那 么 触发 器 是 安全 的 ) ， 但 是 它们 不 是 必要 的 〈 即 有 
一 组 触发 器 是 安全 的 ， 但 是 它们 不 满足 条 件 )。 由 于 没有 算法 来 测试 安全 性 ， 所 以 也 没有 算法 
可 以 检验 的 安全 性 充 要 条 件 。 

有 鉴于 此 ， 在 这 里 给 出 一 个 保证 安全 性 的 充分 条 件 ， 但 是 它 不 能 判断 许多 具有 安全 性 的 
触发 器 系统 。 i 

在 触发 图 (triggering graph) 中 ， 节 点 代表 触发 器 (或 者 外 键 约束 )。 弧 线 从 一 个 触发 器 T 
出 发 到 另 一 个 触发 器 7 终止 ,表示 当 且 仅 当 7 执行 时 会 激活 7。 

可 以 很 容易 地 看 出 ， 使 用 简单 的 语 
法 分 析 就 能 判断 一 个 触发 器 是 否 会 激活 WATCHCOURSEHISTORY CHECKCOURSEVALIDITY 
另 一 个 触发 器 。 实 际 上 ， 激 活 触发 器 的 
事件 在 触发 器 定义 的 BEFORE/AFTER . 
子 名 中 列 出 《或 者 在 外 键 约束 定义 的 sursam) MAINTAINCOURSESNONEMPTY 
ON DELETE/UPDATE 子 句 中 列 出 )。 
触发 器 引发 的 事件 可 以 从 触发 器 主体 图 9-1 触发 器 图 
中 的 语句 确定 。 图 9-1 是 本 章 讨论 的 部 
分 触发 器 的 触发 图 。 

显然 ， 如 果 触 发 器 图 是 非 循环 的 ， 那 么 就 不 可 能 以 一 种 非 终止 的 方式 互相 调用 。 根 据 这 个 
准则 ， 触 发 器 WATCHCOURSEHISTORY、 MAINTAINCOURSESNONEMPTY 和 CHECKCOURSEVALIDITY 不 
可 能 产生 链 式 反应 。 

虽然 这 个 方法 能 够 判断 一 些 系统 的 安全 性 ， 但 是 在 许多 情况 下 它 无 能 为 力 。 实 际 上 ， 触 
发 图 中 LIMITSALARYRAISE 部 分 是 循环 的 ， 因 为 语法 分 析 表 明 执行 会 激活 自身 。 但 是 正如 前 面 
所 说 的 ， 触 发 器 不 会 执行 第 二 次 ， 因 为 WHEN 条 件 为 假 。 这 个 例子 暴露 出 触发 图 的 一 个 主要 
缺点 : 它 没有 考虑 触发 器 的 触发 条 件 的 语义 。 例 如 ， 如 果 可 以 保证 在 触发 图 中 没有 可 以 无 限 
次 运行 的 循环 ， 那 么 这 个 触发 器 系统 就 是 安全 的 。 

还 有 许多 改进 触发 图 的 方法 ， 但 由 于 这 些 内 容 超出 了 本 书 的 范围 ， 我 们 就 不 在 这 里 讨论 了 。 


9.4 参考 书目 


有 关 数 据 库 触发 器 的 基本 概念 可 以 参考 [Paton et al. 1993]。 集 成 触发 器 和 外 键 约束 的 算法 源 自 
[Cochrane et al. 1996]。SQL:1999 触 发 器 的 语法 可 以 参考 最 近 的 SQL 指导 ， 例 如 [Gulutzan and Pelzer 
1999], 

关于 动态 数据 库 的 参考 资料 很 多 ， 本 章 中 关于 SQL:1999 触 发 器 的 介绍 只 是 冰山 一 角 。 感 兴趣 的 读 
者 可 以 参阅 [Widom and Ceri 1996] 进 行 更 深入 的 学 习 。 


9.5 练习 


9.1 说 明 你 的 本 地 DBMS 上 应 用 的 触发 器 的 语义 ， 描 述 定义 触发 器 的 语法 。 
9.2 给 出 从 SQL 触 发 器 和 外 键 约束 的 集合 构建 触发 图 的 准确 的 语法 规则 。 
9.3 补充 MAINTAINCOURSESNONEMPTY ( 见 9.1) 的 触发 器 设计 ， 以 便 在 TRANSCRIPT 表 中 没有 相应 的 记录 
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9.9 
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时 禁止 向 TEACHING 表 中 插入 元 组 。 
设计 一 个 与 MAINTAINCOURSESNONEMPTY 触 发 器 功能 相同 的 行 级 触发 器 。 
定义 触发 器 WArcHCouRSEHISTORY， 它 使 用 LoG 表 记录 事务 对 CouURSE 表 中 各 门 课程 的 所 有 修改 。 
定义 一 个 触发 器 ， 在 学 生 放弃 菜 门 课程 、 改 变 专业 或 者 平均 成 绩 低 于 某 个 闹 值 的 时 候 执行 (为 简单 
起 见 ， 假 设 有 函数 grade_avgO ， 它 以 学 生 Id 为 参数 ， 返 回 这 名 学 生 的 平均 成 绩 ) 。 
考虑 STUDENT (Id , Major) 和 PERSON(Id, Name) 之 间 的 IsA 联 系 。 写 出 合适 的 触发 器 来 维护 这 种 联系 : 
当 从 PERSON 删 除 一 行 的 时 候 ， 必 须 从 STUDENT 表 中 删除 具有 相同 Id 的 行 ; 当 揪 入 一 行 到 表 STupENT 
的 时 候 ， 检 查 是 否 有 相应 的 行 存在 于 PERsoN 表 中 ， 如 果 疫 有 则 中 止 〈 不 要 使 用 FOREIGN KEYRA 
的 ON DELETE 和 ON INSERT 子 句 )。 
证 券 公司 的 数据 库 包 括 表 HoLpINGS(AccountIid，StockSymbol，Price，Quantity) 和 表 
BALANCE(Accountld, Balance)。 编 写 触 发 器 维护 买卖 股票 时 账户 余额 的 正确 性 ， 买 股票 时 会 插入 一 
行 到 HoLpImGs 表 中 或 者 增加 Quantity ， 而 卖 股 票 时 会 从 HoLDINGs 表 中 删除 一 行 或 者 减少 Quantity 。 
在 一 个 企业 中 , 各 个 的 项 目 使 用 的 零件 是 由 不 同 厂商 供应 的 。 定 义 -一 组 合适 的 表 和 相应 的 外 键 约 东 ， 
并 定义 在 下 面 情况 下 执行 的 触发 器 : 当 项 目 改变 某 零件 的 供应 商 的 时 候 ; 当 供 应 商 停止 供应 某 零 件 
的 时 候 ; 当 项 目 停 止 使 用 某 零件 的 时 候 。 

0 触发 器 可 以 立即 判断 并 延迟 执行 ， 那 么 在 判断 和 执行 的 时 候 OLD AS 和 NEW AS 引用 的 是 什么 ? 

1 举例 说 明 SQL:1999 触 发 器 不 仅仅 用 来 维护 完整 性 约束 。 





第 10 章 真实 世界 中 的 SQL 


在 前 面 的 章节 中 ， 我 们 将 SQL 作为 一 种 交互 式 语言 来 讨论 。 每 输入 完 一 条 查询 语句 ， 就 
开始 焦急 地 等 待 ， 接 着 看 到 屏幕 上 出 现 结果 《〈 有 时 会 因 屏 幕 翻 滚 太 快 而 看 不 清楚 )。 这 种 执行 
模式 称 为 直接 执行 (direct execution ) ， 是 最 初 的 SQL 的 一 部 分 。 

在 大 部 分 事务 处 理应 用 中 ，SQL 语 句 被 集成 到 使 用 常用 的 编程 语言 (如 C、Cobol、Java 
或 者 Visual Basic) 编写 的 应 用 程序 中 ， 运 行 这 些 程 序 的 计算 机 和 数据 库 服务 器 所 在 的 计算 机 
不 是 同一 台 计 算 机 。 在 本 章 中 ， 我 们 将 讨论 SQL 的 一 些 高 级 特征 ， 主 要 解决 SQL 在 这 种 模式 
下 运行 时 所 涉及 的 问题 。 本 章 的 目的 在 于 介绍 一 些 基本 概念 ， 因 此 不 会 详细 讲述 语法 选项 。 


10.1 在 应 用 程序 中 执行 SQL 请 名 


我 们 感 兴趣 的 是 生成 一 个 包含 SQL 语句 和 通常 的 编程 语言 语句 的 程序 ， 其 中 SQL 语句 能 
使 程序 访问 数据 库 ， 而 通常 的 编程 语言 (也 叫做 宿主 语言 (host language)) 提供 一 些 SQL 没 有 
的 特征 。 这 些 特 征 包括 诸如 证 语句 和 while 语 句 等 控制 机 制 、 赋 值 语句 以 及 错误 处 理 等 。 

当 讨 论 如 何在 宿主 语言 中 使 用 SQL 语句 时 ， 一 定 会 遇 到 下 面 两 个 问题 : 

在 执行 SQL 语句 之 前 ， 会 执行 一 个 预备 (Preparation ) FR. MSPSRELO HEH, 

然后 生成 一 个 查询 执行 计划 (query execution plan)， 这 个 计划 决定 执行 语句 所 需 步 又 的 

顺序 。 例 如 ， 表 按照 什么 样 的 顺序 进行 联结 ? 是 否 需 要 首先 为 表 进 行 排序 ? 使 用 什么 样 

的 索引 ? 要 检查 哪些 约束 ? 在 第 11 章 中 ， 我 们 将 介绍 访问 路 径 (access path) 的 概念 ， 

它 决定 如 何 访问 表 中 各 行 。 查 询 执行 计划 为 查询 中 的 每 一 张 表 建 立 一 个 访问 路 径 。 因 为 

执行 一 个 SQL 语句 需要 大 量 的 计算 以 及 LO 资源 ， 因 此 需要 仔细 设计 。 查 询 执行 计划 由 

DBMS 使 用 数据 库 模式 和 语句 结构 设计 ， 语句 结构 包括 语句 类 型 (例如 SELECT 和 

INSERT)、 所 要 访问 的 表 和 列 ， 还 有 列 的 域 。 表 中 的 行 数 等 因素 在 进行 查询 优化 的 时 候 

也 要 加 以 考虑 。SQL 语 句 按照 计划 概述 的 步骤 顺序 执行 ， 所 涉及 到 的 问题 将 在 第 14 章 中 

详细 讨论 。 

。 有 两 种 方式 可 以 在 应 用 程序 中 使 用 SQL 结构 : 

语句 级 接口 (Statement-Level Interface, SLI) SQL 结构 在 程序 中 以 新 的 语句 类 型 的 方式 
出 现 ， 这 样 程序 不 仅 包含 宿主 语言 而 且 包 含 新 的 语句 类 型 。 在 使 用 宿主 语言 编译 器 编译 程序 
之 前 ， 必 须 先 用 预 编译 器 (precomplier) 处 理 SQL 结 构 ， 它 将 SQL 结 构 转 换 成 对 宿主 语言 过 
程 的 调用 。 经 过 预 编译 之 后 的 程序 才能 使 用 宿主 语言 编译 器 编译 。 运 行 时 ， 这 些 过 程 与 
DBMS 进 行 通信 ，DBMS 会 采取 必要 的 动作 执行 SQL。 

SQL 结构 有 两 种 形式 。 第 一 种 是 峙 入 式 SQL (embedded SQL ) ， 也 就 是 通常 所 说 的 SQL 语 
句 〈 例 如 SELECT 和 INSERT) ; 第 二 种 是 预备 和 执行 SQL 语句 的 指令 ， 但 是 SQL 语 自 是 以 字 
符 囊 变量 的 值 的 形式 出 现在 程序 中 的 ， 而 字符 事变 量 是 在 运行 时 由 程序 的 宿主 语言 部 分 构造 
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的 。 在 第 二 种 情况 下 ， 真 正 要 执行 的 SQL 语句 在 编译 的 时 候 并 不 知道 ， 所 以 这 种 形式 也 被 称 
为 动态 SQL (dynamic SQL ) 。 而 与 此 对 应 的 嵌入 式 SQL 在 编译 的 时 候 已 经 知道 并 且 被 直接 写 
进程 序 中 ， 因 此 做 入 式 SQL 也 被 称 作 静 态 SQL (static SQL )。SQL-92 是 戏 入 式 SQL 的 一 个 标 
准 ， 而 SQLJ 是 一 种 专门 为 Java 设 计 的 SLI。 

调用 级 接口 (Call-Level Interface, CLI) 与 静态 和 动态 SQL 不 同 的 是 ， 应 用 程序 完全 是 
用 宿主 语言 编写 的 。 但 是 和 动态 SQL 一 样 ，SQL 语 句 是 在 运行 时 生成 的 字符 串 变 量 的 值 ， 这 
些 变量 作为 参数 传递 给 CLI 提 供 的 宿主 语言 过 程 。 因 为 没有 使 用 特殊 的 语法 ， 所 以 不 需要 经 过 
预 编译 。 

在 本 章 中 ， 我 们 会 讨论 两 种 调用 级 接口 : Java 数 据 库 互 连 (Java DataBase Connectivity, 
JDBC) 和 开放 式 数据 库 互 连 (Open DataBase Connectivity，ODBC )。 前 者 是 专门 为 Java 语 言 
设计 的 ， 而 后 者 被 多 种 语言 所 支持 。 最 近 完 成 的 SQL:1999 对 调用 级 接口 进行 了 标准 化 ， 该 标 
准 与 ODBC 十 分 类 似 ， 所 以 有 人 预测 两 者 将 会 最 终 合并 。 
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数据 库 模式 在 编写 程序 的 时 候 必 须要 知道 ， 这 样 才能 创建 SQL 语句 。 例 如 ， 程 序 员 必 须知 道 
表 的 名 称 和 列 的 名 称 以 及 域 。 

在 宿主 语言 编译 器 编译 程序 之 前 ， 会 有 一 个 预 编译 器 (通常 由 DBMS 厂 商 提 供 ) 扫描 应 
用 程序 并 且 确 定 风 入 式 SQL 语 句 的 位 置 。 因 为 这 些 语句 不 是 宿主 语言 的 一 部 分 ， 所 以 宿主 语 
言 编译 器 不 会 处 理 它们 。 相 反 ， 通 过 某 种 特殊 的 语法 将 伐 入 式 SQL 语 句 与 其 他 部 分 分 开 ， 使 
得 预 编译 器 能 够 识别 它们 。 预 编译 器 将 每 条 语句 转换 成 一 连 串 用 宿主 语言 编写 的 对 运行 时 链 
接 库 (run-time library) 的 子 程序 的 调用 ， 这 样 才 能 被 宿主 语言 编译 器 在 下 个 阶段 进行 处 理 。 
当 程 序 运行 并 执行 SQL 语句 的 时 候 ; 会 调用 这 些 子 程序 ， 它 们 将 原先 谋 入 在 应 用 程序 中 的 
SQL 语句 发 送 给 DBMS ， 由 DBMS 负 责 预 备 和 执行 这 些 SQL 语 句 。 

由 预 编译 器 检查 每 个 SQL 语句 的 形式 并 预备 查询 计划 是 合理 的 ， 因 为 这 将 会 大 大 降低 运 
行 时 的 负载 。 不 过 ， 很 多 预 编 译 器 并 不 是 这 样 做 的 。 预 备 要 求 预 编译 器 与 DBMS 通 信 (确定 
SQL 语 句 所 要 访问 的 数据 库 模 式 )， 而 这 种 通信 在 编译 的 时 候 不 一 定 可 行 。 另 外 ， 因 为 查询 执 
行 计划 可 能 取决 于 表 的 规模 ， 所 以 这 种 预备 越 在 接近 运行 时 进行 效果 越 好 。 

在 最 好 的 情况 下 ， 贬 入 式 SQL 结 构 使 用 SQL-92 或 者 SQL:1999 编 写 ， 然 后 DBMS 的 预 编译 
器 执行 必要 的 转换 ， 将 它 转换 成 该 DBMS 可 以 识别 的 SQL 专用 语言 。 但 是 在 现实 世界 中 ， 大 
部 分 编译 器 不 作 这 样 的 转换 ，SQL 结 构 必 须 使 用 DBMS 的 SQL 专用 语言 。 因 而 在 实际 中 ， 必 须 
在 编写 程序 的 时 候 知道 DBMS 和 数据 库 模 式 。 

要 求 应 用 程序 使 用 DBMS 的 专用 语言 有 一 个 缺点 ， 就 是 如 果 将 来 需要 转换 到 另外 一 种 使 
用 不 同 专用 语言 的 DBMS 的 时 候 会 带 来 一 些 问题 。 不 过 在 某 些 情况 下 ， 使 用 DBMS 的 专用 语言 
有 一 个 优点 ， 许 多 DBMS 对 SQL 进行 专 有 的 扩展 ， 如 果 企 人 到 宿主 语言 中 的 SQL 是 SQL-92， 
那么 程序 员 就 不 能 使 用 这 些 扩展 功能 。 当 然 ， 如 果 应 用 程序 使 用 由 DBMS 提 供 的 这 种 专门 的 
扩展 ， 那 么 就 会 增加 转换 到 不 同 DBMS 的 难度 。 
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SQL-92 标 准 要 求 戏 入 式 SQL 的 实现 至 少 要 为 以 下 7 种 语言 提供 预 编译 器 : Ada、C、 
COBOL, Fortran. M (MUMPS) 9 、Pascal 和 PL/1。 事 实 上 ， 同 样 可 以 获得 其 他 语言 专用 的 
预 编译 器 。 一 些 应 用 生成 器 提供 自己 专用 的 宿主 语言 和 人 嵌 人 式 SQL 专 用 语言 ， 并 且 提 供 一 个 
编译 器 (或 者 解释 器 ) 使 SQL 结构 能 够 访问 某 些 PDBMS 。 

图 10-1 是 一 个 包含 娆 入 式 SQL 语 句 的 C 语 言 程序 片段 。 每 个 修 入 式 SQL 语 句 由 EXEC SQL 
开头 ， 这 样 才 能 被 预 编译 器 定位 。 这 里 使 用 的 是 SQL-92 语 法 ， 但 是 我 们 要 知道 许多 数据 库 厂 
商 使 用 它们 自己 的 SQL 专用 语言 〈 或 者 早期 的 SQL 标准 提供 的 语法 )。 

EXEC SQL BEGIN DECLARE SECTION; 


unsigned long num_enrolled; 
char *crs_code, *semester; 


EXEC SQL END DECLARE SECTION; 


.. other host language declarations and statements . . . 
... get the values for semester and crs_code... 


EXEC SQL SELECT C.Enrollment 
INTO :num_enrolled 
FROM Crass C 
WHERE C.CrsCode = :crs_code 
AND C.Semester = :semester; 


... the rest of the host language program ... 
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本 章 的 所 有 例子 均 来 自 下 面 两 个 模式 : 


CLASS(Cr$Ccode :CHAR(6) , Semester :CHAR(6) ， 

Enrollment: INTEGER, ProfId:CHAR(9), Room:CHAR(10)) 

#24 Crass: {CrsCode, Semester} 

TRANSCRIPT (StudId: INTEGER, CrsCode:CHAR(6), Semester: CHAR(6), 

Grade: CHAR(1)) 

gt) TRANSCRIPT: {StudId, CrsCode, Semester} 

属性 CrsCode、Semester 和 Grade 的 取 值 范围 和 图 4-$ 中 所 示 的 取 值 范围 一 致 ， 即 CrsCode 是 
形 如 “MAT123” 或 者 “CS305” 的 字符 串 ，Semester 是 形 如 “F1999” 和 “S2000” 的 字符 串 ， 
而 Grade 是 形 如 “A” 或 者 “B” 的 字母 。 

为 了 使 应 用 程序 作为 一 个 整体 和 数据 库 通信 ， 窒 主语 言语 句 和 SQL 语句 必须 能 够 访问 公 
共 变 量 。 这 样 ， 由 程序 的 宿主 语言 部 分 计算 的 结果 才 可 以 存储 在 数据 库 中 ， 而 从 数据 库 中 得 
到 的 数据 也 能 被 宿主 语言 语句 处 理 。 

图 10-1 的 第 一 部 分 声明 宿主 程序 的 变量 ， 也 称 为 宿主 变量 (host variable ) ， 使 用 它们 可 以 
达到 上 面 的 目的 。 声 明 包含 在 EXEC SQL BEGIN DECLARE SECTION 和 EXEC SQL END 
DECLARE SECTION 之 间 ， 这 样 才 容易 被 预 编译 器 发 现 并 处 理 。 但 声明 本 身 不 是 以 EXEC 
SQL 开头 的 。 这 样 ， 声 明 以 便 能 同时 被 预 编 译 器 和 宿主 预 语言 编译 器 处 理 。 


© MUMPS 是 Massachusetts General Hospital Utility Multi-Programming System 的 缩写 。 
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图 中 的 宿主 变量 用 于 SELECT 语句 中 。 注 意 ， 在 SELECT 语句 中 ， 每 个 宿主 变量 前 面 的 冒 
号 是 用 来 与 数据 库 模式 的 表 名 和 列 名 相 区 别 的 。 字 段 Enrollment 的 值 被 赋 给 宿主 变量 
num_enrolled， 在 执行 完 SELECT 语 名 后 宿主 语言 语句 可 以 以 通常 的 方式 访问 。 

因为 CrsCode 和 Semester 一 起 构成 表 CLAss 的 主键 ， 所 以 SELECT 语句 上 只 返回 一 行 。 这 十 分 
关键 ， 因 为 如 果 SELECT 返 回 多 行 ， 那 么 将 哪 一 个 赋值 给 变量 num_enrolled 呢 ? 因此 如 果 返 回 
的 行 数 多 于 一 行 ， 那 么 这 个 SELECT INTO 语 句 就 有 错误 。 我 们 将 在 10.2.4 节 讨论 返回 多 行 的 
情况 。 ` 

我 们 可 以 把 宿主 语言 变量 理解 为 将 SQL 语句 参数 化 ， 它 们 用 来 传递 标量 值 (scalar value), 
而 不 是 表 名 、 列 名 或 者 结构 化 的 数据 。WHERE 子 句 中 使 用 的 宿主 变量 对 应 输入 参数 (in 
parameter) ， 而 INTO 子 句 中 的 宿主 变量 对 应 输出 参数 (out parameter)。 当 执行 语句 的 时 候 ， 
输入 参数 的 值 用 来 构成 一 个 完整 的 能 被 数据 库 管理 器 执行 的 SQL 语句 。 但 是 要 注意 ，SQL 语 
名 在 输入 参数 的 值 确定 之 前 可 以 被 预 处 理 ， 因 为 已 知 表 名 和 列 名 ( 它们 不 可 能 作为 参数 ) 。 所 
以 第 一 次 执行 语句 时 使 用 的 查询 执行 计划 可 以 被 保存 下 来 以 便 在 将 来 同一 语句 再 一 次 执行 时 
使 用 (因为 每 次 执行 时 只 是 参数 的 取 值 不 同 ) ， 这 是 嵌入 式 SQL 的 一 大 优点 。 预 编译 器 一 个 功 
能 是 在 运行 时 调用 子 程序 ， 传 递 值 给 宿主 语言 变量 或 者 从 宿主 语言 变量 取得 值 ， 并 以 一 种 规 
范 化 的 形式 与 DBMS 进 行 通信 。 


10.2.1 状态 处 理 


在 现实 世界 中 ， 事 情 不 总 是 像 想 象 的 那样 简单 。 例 如 当 你 试图 连接 远 端 服务 器 上 的 数据 
库 的 上 时候， 服务 器 可 能 关闭 或 者 拒绝 连接 。 有 时 ， 试 图 执行 INSERT 语 旬 也 会 被 DBMS 拒 绝 ， 
因为 它 违反 了 约束 。 你 可 以 把 它们 归 类 到 错误 情况 中 去 ， 因 为 请 求 的 操作 没有 被 执行 。 在 另 
外 一 些 情况 中 ，SQL 语 句 被 正确 执行 并 且 返 回 描述 执行 结果 的 信息 。 例 如 ，DELETE 语 名 返回 
删除 的 行 数 。SQL 提 供 两 种 机 制 将 描述 这 些 情况 的 返回 信息 传递 给 宿主 程序 : 长 度 为 5 的 字符 
串 SQLSTATE 和 诊断 域 (diagnostics area). 

图 10-2 在 图 10-1 的 基础 上 增加 了 状态 处 理 部 分 。SQLSTATE 在 声明 部 分 进行 声明 ， 因 为 它 
用 来 在 DBMS 和 应 用 程序 的 宿主 语言 部 分 之 间 进 行 通信 9 。 所 有 人 嵌 人 式 SQL 程序 必须 要 有 这 个 
声明 。 每 当 一 个 SQL 语句 执行 结束 ，DBMS 会 将 信息 存储 在 这 个 字符 串 中 。 可 以 使 用 条 件 语 
名 判断 SQLSTATE 的 值 ， 如 果 值 为 “00000"， 则 说 明 上 一 次 的 SQL 语句 执行 成 功 ， 否 则 要 判 
断 出 了 什么 样 的 异常 ， 以 便 采 取 适 当 的 措施 。 在 上 面 的 程序 中 ， 打 印 出 一 条 状态 信息 。 

除了 在 执行 完 SQL 语 句 后 判断 状态 外 ， 还 可 以 在 执行 第 一 个 SQL 语句 前 的 任何 一 个 地 方 
加 入 下 面 的 WHENEVER 语 句 : ， 

EXEC SQL WHENEVER SQLERROR GOTO label; 

这 时 只 要 执行 的 语句 返回 非 零 状 态 ， 程序 就 会 跳 转 到 label 标 识 的 地 方 。 在 调用 另外 一 个 
WHENEVER 语 名 前 ， 当 前 的 WHENEVER 一 直 有 效 。 


O 当 在 C 语 言 中 使 用 SQL 的 时 候 ，SQLSTATE 被 声明 为 长 度 为 6 个 字符 的 字符 串 , 因 为 最 后 一 个 字符 在 C 中 用 
来 标识 字符 串 的 终止 。 注 意 在 SQL 语句 中 ，SQLSTATE 前 面 没 有 冒号 ， 因 为 预 处 理 程序 把 它 看 作 特 殊 的 关 
键 字 。 

O 早期 版 本 的 SQL 使 用 的 技术 稍 有 不 同 ， 状态 是 通过 一 个 整 型 变量 SQLCODE 来 传递 的 。 
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#define OK "00000" 

EXEC SQL BEGIN DECLARE SECTION; 
char SQLSTATE [6] ; 
unsigned long num_enrolled; 
char *crs_code, *semester; 

EXEC SQL END DECLARE SECTION; 


. other statements; get the values for crs_code, semester ... 


EXEC SQL SELECT C.Enrollment 
INTO :num_enrolled 
FROM CLASS C 
WHERE C.CrsCode = :crs_code 
AND C.Semester = :semester; 
if (stremp(SQLSTATE,OK) != 0) 
printf ("SELECT statement failed\n"); 





图 10-2 增加 状态 处 理 


有 关上 一 次 SQL 语句 的 执行 结果 的 更 详细 的 信息 可 以 通过 调用 GET DIAGNOSTICS 语句 
从 诊断 域 获得 。 一 条 SQL 语 名 可 能 会 抛 出 多 个 异常 ， 诊 断 域 可 以 记录 所 有 异常 的 信息 。 

在 这 里 要 介绍 一 下 字符 串 的 标记 方法 ， 以 免 将 来 混淆 。 在 SQL 中 (包括 在 嵌入 式 SQL 中 ) 
字符 串 用 单 引 号 标识 ， 而 在 很 多 宿主 语言 (例如 C 和 Java) 中 用 双 引 号 标识 ， 因 此 在 一 个 包含 
代入 式 SQL 语句 的 C 语 言 程 序 中 会 同时 有 两 种 标识 ， 例 如 : 


semester = "F2000"; 
EXEC SQL SELECT C.Enrollment 
INTO :num_enrolled 
FROM CLASS C 
WHERE C.CrsCode = 'CS305' 
AND C.Semester = :semester; 


字符 串 “F2000” 出 现在 通常 的 赋值 语句 中 ， 由 C 语 言 编译 器 处 理 ， 而 “CS305” 出 现在 
SQL 语句 中 ， 由 SQL 预 处 理 程序 处 理 。 


10.2.2 会 话 、 连接 和 事务 


我 们 先 介绍 SQL 标准 的 一 些 术语 。SQL 代 理 (agent) 就 是 执行 包含 SQL 语句 的 应 用 程序 ， 
SQL 代理 运行 在 SQL 客户 端 (client). SQL 代 理 在 对 数据 库 执行 任何 操作 之 前 ， 必 须 与 5QL 服 
Sak (server) 建立 SQL 连接 (connection )。 这 个 连接 在 服务 器 上 创建 一 个 SQL 会 话 (session )。 
一 且 建 立 起 会 话 ，SQL 代 理 可 以 执行 任意 多 个 事务 (transaction ) ， 直 到 从 数据 库 断 开 连 接 、 
结束 这 个 会 话 为 止 。 

SQL 连 接 通 过 执行 CONNECT 语 句 建立 (也 有 可 能 隐 式 地 建立 )， 它 的 一 般 形式 是 : 


CONNECT TO {DEFAULT | db-name-string} 
[AS connection-name-string] [USER user-id-string] 


方 括号 里 的 选项 是 可 选 的 ， 而 花 括号 里 有 若干 个 选项 ， 每 个 选项 用 竖 线 隔 开 ， 使 用 的 时 候 必 
须 有 而 且 只 能 有 一 项 被 选用 。 
选项 db-name-string 是 数据 源 的 名 称 ，connection-name-string 是 这 个 连接 的 名 称 ， 而 user- 
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id-string 是 用 户 的 名 称 (数据 源 可 以 使 用 它 进行 授权 )。 指 定数 据 源 的 格式 取决 于 不 同 的 供应 
商 。 它 可 以 是 标识 本 地 机 上 的 一 个 数据 库 的 名 称 的 字符 串 ， 也 可 以 是 远程 机 上 的 一 个 数据 库 
的 名 称 ， 例 如 : 

tcp:postgresql://db.xyz.edu:100/studregDB 

程序 可 以 通过 CONNECT 语 名 连接 到 不 同 的 服务 器 上 ， 一 旦 建立 新 的 连接 和 会 话 ， 原 来 
的 连接 和 会 话 就 会 被 替代 。 如 果 想 在 不 同 的 连接 和 会 话 之 间 切 换 ， 可 以 通过 执行 下 面 的 语句 
实现 : 

SET CONNECTION TO {DEFAULT | connection-name-string} 

下 面 的 语句 终止 SQL 连接 和 会 话 (也 有 可 能 隐 式 地 终止 ): 


DISCONNECT {DEFAULT | db-name-string} 


10.23 执行 事务 


SQL-92 没 有 专门 的 语句 来 创建 事务 。 每 当 第 一 条 访问 数据 库 的 SQL 语句 在 会 话 中 执行 的 
时 候 ， 就 会 自动 创建 一 个 事务 。 事 务 通过 COMMIT 或 者 ROLLBACK 结 束 ， 下 一 个 SQL 语 名 
(COMMIT 或 者 ROLLBACK 之 后 ) 又 会 重新 创建 一 个 事务 。 这 个 过 程 称 作 链 (chaining )， 它 
将 在 第 21 章 讨论 。。 

事务 的 默认 执行 模式 是 READ/WRITE， 也 就 是 说 事务 既 可 以 读数 据 库 也 可 以 修改 数据 
库 。 另 外 一 种 可 选 模式 是 READ ONLY ， 它 只 允许 读数 据 库 ， 以 防止 未 授权 用 户 对 数据 库 进 
行 更 改 。 

第 2 章 已 经 指出 ， 虽 然 可 序列 化 的 调度 可 以 保证 所 有 应 用 正确 执行 ， 但 是 为 了 提高 性 能 可 
以 使 用 较 低 的 隔离 级 别 。 默 认 的 隔离 级 别 是 SERIALIZABLE， 还 有 其 他 的 可 选项 ， 我 们 将 在 
第 15 章 ~ 第 24 章 里 详细 讨论 这 些 级 别 。 

如 果 想 改变 默认 的 执行 模式 ， 可 以 使 用 SET TRANSACTION 语 句 ， 例 如 : 


SET TRANSACTION READ ONLY 
ISOLATION LEVEL READ COMMITTED 
DIAGNOSTICS SIZE 6; 


这 条 语句 设置 模式 为 READ ONLY， 同 时 设置 隔离 级 别 为 READ COMMITTED。 可 以 选择 的 
隔离 级 别 有 : 


READ UNCOMMITTED 
READ COMMITTED 
REPEATABLE READ 
SERIALIZABLE 


DIAGNOSITICS SIZE 决 定 在 诊断 域 中 可 以 一 次 性 描述 的 异常 状况 的 数目 ， 这 些 异 常 是 由 最 近 
一 次 执行 的 SQL 语句 抛 出 的 。 
图 10-3 说 明 如 何 使 用 连接 和 事务 语句 以 及 状态 处 理 。 可 以 看 到 ， 声 明之 后 是 一 个 连接 到 


© 在 SQL:1999 中 ， 可 以 使 用 START TRANSACTION 语 句 创建 事务 。 它 可 以 指定 事务 的 特征 ， 与 SET 
TRANSACTION 语 名 类似， 后 面 将 会 描述 这 个 语句 。 

© SQL:1999 也 有 COMMIT AND CHAIN 和 ROLLBACK AND CHAIN 语 句 ， 这 两 个 语句 在 完成 提交 和 回 退 后 
立刻 开始 一 个 新 的 事务 ， 而 不 需要 等 到 执行 下 一 个 SQL 语句 才 开 始 新 的 事务 。 
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服务 器 上 的 语句 ， 该 语言 没有 提供 显 式 创 建 事务 的 方式 ， 相 反 一 旦 建立 连接 就 会 隐 式 地 创建 
一 个 事务 。 


#define OK "00000" , 
EXEC SQL BEGIN DECLARE SECTION; 
unsigned long stud_id; 
char *crs_code, *semester; 
char SQLSTATE [6] ; 
char *dbName; 
char *connectName; 
char *userld; . 
EXEC SQL END DECLARE SECTION; 


// Get values for dbName, connectName, userId 
dbName = "studregDB" ; 

connectName = "conni"; 

userId = "ji21"; 


. other statements ... 


EXEC SQL CONNECT TO :dbName AS :connectName USER :userId; 
if (stremp(SQLSTATE,OK) != 0) 
exit(1); 


... get the values for stud_id, crs_code, etc. ... 


EXEC SQL DELETE FROM TRANSCRIPT 
WHERE StudId = :stud_id 
AND Semester = :semester 
AND CrsCode = :crs_code; 


if (strcmp(SQLSTATE,OK) != 0) 
EXEC SQL ROLLBACK; 
else { 
EXEC SQL UPDATE CLASS 
SET Enrollment = (Enrollment ~ 1) 
WHERE CrsCode = :crs_code 
AND Semester = :semester; 


if (strcmp(SQLSTATE,OK) != 0) 
EXEC SQL ROLLBACK; 
else 
EXEC SQL COMMIT; 
} 
EXEC SQL DISCONNECT :connectName; 





图 10-3 在 C 程 序 中 使 用 嵌入 式 SQL 语句 实现 连接 和 事务 处 理 ， 将 学 生 从 某 门 课程 中 注销 


图 中 所 示 程 序 的 作用 是 注销 选修 一 门 课程 的 学 生 。 这 里 假设 宿主 语言 变量 semester 存 储 当 
前 的 学 期 ， 可 以 通过 调用 操作 系统 的 系统 时 间 time() 获 得 。 程 序 对 数据 库 状 态 进行 两 次 更 新 ， 
一 次 是 从 TRANSCRIPT 表 中 删除 学 生 注册 某 门 课程 的 信息 ， 另 一 次 是 在 CLAss 表 中 更 新 这 门 课程 
的 人 数 Enrollment。 只 要 DELETE 和 和 UPDATE 语句 中 任何 一 个 发 生 失 败 ， 就 会 导致 SQLSTATE 
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的 值 不 是 “00000"， 从 而 执行 ROLLBACK 语 名 °; 如 果 没 有 发 生 错 误 ， 会 执行 COMMIT 语 句 。 
最 后 事务 断 开 连接 。 

当 应 用 执行 EXEC SQL COMMIT 或 者 EXEC SQL ROLLBACK 的 时 候 ， 就 会 请 求 当 前 连接 
的 数据 库 服 务 器 S 提 交 或 者 回 退 对 数据 库 做 的 任何 改变 。 但 是 应 用 程序 执行 的 事务 可 能 不 只 是 
访问 单一 数据 库 服务 器 。 例 如 ， 通 过 建立 若干 个 连接 并 在 不 同 的 连接 之 间 进 行 切 换 ， 程 序 可 
以 访问 不 同 的 数据 库 服务 器 ， 或 者 将 计算 的 结果 放 到 本 地 的 文件 系统 中 。 因 为 COMMIT 和 
ROLLBACK 会 通过 连接 被 传递 给 数据 库 服务 器 S， 所 以 相应 的 操作 不 能 在 这 种 情况 下 应 用 。 

如 采 程 序 连 接 到 多 个 数据 库 ， 不 同 服务 器 上 的 事务 可 以 单独 提交 或 者 回 退 ， 然 而 包含 单 
独 事务 的 全 局 事务 可 能 不 具有 原子 性 ， 这 个 问题 将 在 第 26 章 进一步 讨论 。 


10.2.4 游标 


作为 数据 库 语言 ，SQL 语 言 的 一 个 优势 是 可 以 处 理 整 张 表 ， 因 此 SELECT 语句 返回 的 可 能 
是 张 表 ， 这 张 表 称 为 查询 结果 (query result) 或 者 结果 集 (result set) 。 当 语句 是 以 直接 的 或 
者 交互 的 方式 执行 而 不 是 代 人 到 程序 里 执行 的 时 候 ， 可 能 整个 屏幕 都 无 法 完整 地 显示 结果 集 。 
例如 ， 下 面 的 SELECT 语句 返回 某 个 学 期 中 参加 某 门 课程 的 所 有 学 生 的 Id 和 成 绩 : 

EXEC SQL SELECT T.StudId, T.Grade 

FROM TRANSCRIPT T 


WHERE T.Semester = :semester 
AND T.CrsCode = :CIS_code ; 


假如 在 宿主 语言 程序 中 要 包含 这 样 的 查询 ， 但 是 返回 的 行 数 只 有 在 执行 完 语 句 后 才 知 道 ， 那 
么 在 程序 里 无 法 为 未 知 的 行 数 分 配 内存 。 例 如 如 果 使 用 数组 ， 那 么 这 个 数组 有 多 大 呢 ? 

为 了 处 理 这 个 问题 ，SQL 引 进 了 游标 (cursor) 机 制 ， 它 允许 应 用 程序 一 次 处 理 结果 集中 
的 一 行 。 游 标 类 似 于 指针 ， 可 以 指向 结果 集 的 任何 一 行 。FETCH 语 名 获得 游标 所 指向 的 行 并 
将 该 行 的 属性 值 赋 给 程序 中 的 宿主 语言 变量 。 这 种 方式 只 需要 将 一 行 的 值 赋 给 变量 。 根 据 数 
据 库 模 式 可 以 知道 每 行 的 值 的 类 型 ， 从 而 声明 通 当 类 型 的 变量 。 

图 10-4 是 使 用 了 游标 的 嵌入 式 SQL 程 序 片 段 。DECLARE CURSOR 语 名 声明 游标 的 名 字 为 
GETENROLLED, ， 指 定 类 型 是 INSENSITIVE (后 面 将 会 讨论 这 个 限定 词 )， 并 将 它 与 某 个 
SELECT 语句 联系 在 一 起 。 但 是 这 个 SELECT 语句 现在 并 没有 被 执行 ， 直 到 执行 OPEN 语 句 时 
才 执 行 这 条 SELECT 语句 。 

在 示例 中 ，SELECT 有 两 个 参数 ， 分 别 是 宿主 变量 crs_code 和 semester， 它 们 将 参数 值 传 
递 给 SELECT 语句 ， 要 求 返回 属性 CrsCode 和 Semester 的 值 分 别 等 于 这 两 个 参数 值 的 行 。 当 
OPFEN 语 名 执行 的 时 候 会 发 生 参 数 替 代 ， 接 着 执行 SELECT 语句 。 因 此 在 打开 游标 后 再 对 参数 
做 修改 不 会 对 检索 到 的 元 组 产生 任何 影响 ，OPEN 会 把 游标 定位 到 结果 集 的 第 一 行 之 前 ， 

执行 FETCH 语 名 会 使 游标 向 前 移动 ， 因 此 图 10-4 中 的 FETCH 语 名 将 使 游标 指向 结果 集 的 
第 一 行 ， 获 取 该 行 的 值 并 将 相应 的 值 存储 在 宿主 语言 变量 staud_id 和 grade 中 。 CLOSE 语句 关闭 


O 如果 DELETE 语 句 失败 ,这 时 没有 对 数据 库 进行 任何 更 新 ， 也 许 有 人 会 认为 这 里 没有 必要 使 用 ROLLBACK。 
但 是 ， 必 须 通知 系统 事务 已 经 结束 以 便 在 系统 日 志 中 记录 适当 的 条 目 ， 而 事务 获得 的 锁 也 因此 而 释放 。 H 
志 是 系统 确保 事务 原子 性 机 制 的 一 部 分 ( 见 25.2 节 )， 而 锁 是 系统 保证 隔离 的 机 制 的 一 部 分 ( 见 23.5 节 )。 
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游标 (这 个 示例 仅仅 获取 结果 集 的 第 一 行 的 值 ， 下 面 的 示例 将 更 接近 真实 的 情形 )。 


#define OK "00000" 

EXEC SQL BEGIN DECLARE SECTION; 
unsigned long stud_id; 
char grade[1]; 
char *crs_code, *semester; 
char SQLSTATE [6] ; 

EXEC SQL END DECLARE SECTION; 


. input values for crs_code, semester, etc. ... 


EXEC SQL DECLARE GETENROLLED INSENSITIVE CURSOR FOR 
SELECT T.Studid, T.Grade 
FROM TRANSCRIPT T 
WHERE T.CrsCode = :crs_code 
AND T.Semester = :semester; 


EXEC SQL OPEN GETENROLLED ; 
if (strcmp(SQLSTATE,OK) != 0) { 
printf("Can't open cursor\n"); 
exit(1); 
} . 
EXEC SQL FETCH GETENROLLED INTO :stud_id, :grade; 
if (strcmp(SQLSTATE,OK) != 0){ 
printf("Can't fetch\n"); 
exit(1); 
} 
EXEC SQL CLOSE GrTENROLLED; 





图 10-4 使 用 游标 


程序 中 的 每 个 SQL 语句 都 有 一 些 可 选项 ，DECLARE CURSOR 语 句 也 不 例外 ， 它 的 一 般 
形式 如 下 : 
DECLARE cursor-name { INSENSITIVE ] [ SCROLL] CURSOR FOR 
table-expression 


{ ORDER BY order-item-comma-list] 
{ FOR { READ ONLY | UPDATE [ OF column-commalist]} ] 


其 中 ，table-expression 通 常 是 一 个 表 名 ， 也 可 以 是 视图 或 者 SELECT 语 句 9 。 

选项 INSENSITIVE 的 含义 是 执行 OPEN 语 句 将 会 有 效 地 创建 一 个 结果 集 的 拷贝 ， 所 有 通 
过 游标 的 访问 都 指向 这 个 拷贝 。SQL 标 准 使 用 “有 效 地 ”这 个 词 的 含义 是 标准 中 不 指定 使 用 
什么 样 的 方式 来 实现 ,但 是 必须 和 建立 一 个 拷贝 有 相同 的 作用 。 这 种 返回 数据 有 时 也 称 作 快 
照 (snapshot). 

INSENSITIVE 游 标的 语义 很 直观 。 当 OPEN 语 名 执行 的 时 候 ，SELECT 语 句 隐 含 的 对 基 表 
的 选择 操作 执行 ， 并 计算 和 存储 结果 集 。 在 稍 后 可 以 通过 游标 访问 这 个 拷贝 。 例 如 ， 图 10-5 
显示 的 是 执行 图 10-4 得 到 的 结果 集 , 参数 crs_code 和 semester 的 值 分 别 是 “F1997” 和 “CS315”， 
可 以 看 到 有 一 个 游标 指向 结果 集 的 拷贝 ， 而 不 是 指向 原 表 。 


O 还 有 其 他 一 些 可 选项 ， 由 于 它们 超出 了 本 书 的 讨论 范围 ， 就 不 在 这 里 讨论 了 。 
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TRANSCRIPT 表 


图 10-5 使 用 INSENSITIVE 游 标 有 效 地 生成 结果 集 ， 获 取 行 的 时 候 并 没有 访问 原 表 


因为 INSENSITIVE 游 标 访问 的 是 结果 集 的 拷贝 ， 因 此 打开 INSENSITIVE 游 标 后 当前 事务 
里 任何 对 基 表 的 操作 都 不 会 通过 游标 看 到 ， 当 然 通 过 游标 进行 的 操作 例外 。 例 如 ， 事 务 在 打 
开 游 标 后 执行 下 面 的 语句 : 


INSERT INTO TRANSCRIPT 
VALUES ('656565656', 'CS315', 'F1997', 'C'); 


它 直接 插入 (不 是 通过 游标 ) 一 行 新 的 记录 到 表 TRANSCRIPT 中 :虽然 在 GETENROLLED 打 开 的 时 
候 crs_code 的 值 是 “CS315” 而 且 当 前 的 semester 是 “F1997”, 但 是 游标 不 能 获得 这 个 新 行 的 
值 。 即 使 打开 游标 后 事务 使 用 UPDATE 语 句 更 新 了 在 结果 集中 的 某 行 的 值 ， 游 标 也 看 不 到 。 
类 似 地 ， 在 打开 游标 后 由 其 他 并 发 事务 对 基 表 进行 的 修改 同样 无 法 通过 游标 看 到 

当 没 有 指定 INSENSITIVE 选 项 的 时 候 ，SQL 标 准 没有 规定 对 基 表 的 操作 会 有 什么 样 的 结 
ek, 数据库 供应 商 可 以 自由 选择 他 们 认为 合适 的 实现 方式 。 许 多 供应 商 使 用 
KEYSET_DRIVEN， 它 是 ODBC 标 准 的 一 部 分 ， 其 相关 内 容 将 在 10.6 节 中 讨论 。 

如 果 没 有 指定 INSENSITIVE， 也 没有 声明 游标 为 READ ONLY， 并 且 游 标 声 明 中 的 SQL 
查询 满足 可 更 新 视图 ( 见 6.3 节 ) 的 要 求 ， 那 么 基 表 当前 行 的 更 新 和 删除 可 以 通过 游标 实现 ， 
这 时 称 游标 是 可 更 新 的 。UPDATE 和 DELETE 语 句 分 别 用 于 实现 更 新 和 删除 操作 ， 不 过 
WHERE 子 句 被 WHERE CURRENT OF cursor-nameft##®, 下面 是 一 般 的 语法 : 


UPDATE table-name 
SET assignment-comma-list 
WHERE CURRENT OF cursor-name 


DELETE 
FROM table-name 
WHERE CURRENT OF cursor-name > 


因为 INSENSITIVE 游 标 指向 结果 集 的 拷贝 a 所 以 UPDATE 和 DELETE 对 用 于 计算 出 结果 
集 的 基 表 不 会 有 任何 影响 。 为 了 避免 混淆 ;这 些 操作 不 能 通过 INSENSITIVE 游 标 执行 。 

如 果 想 对 结果 集 的 行进 行 排序 ， 可 以 通过 ORDER BY 子 句 实现 。 例 如 在 GETENROLLED 的 
声明 中 指定 

ORDER BY Grade 
那么 结果 集 将 会 按照 Grade 的 升序 排序 。 

FETCH 语 句 的 一 般 形式 是 : 


FETCH [ [ row-selector ] FROM ] cursor-name 
INTO target-commalist 
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其 中 ， target-commalist 是 宿主 语言 变量 的 列表 ， 变量 的 数量 和 类 型 必须 与 游标 指向 的 结果 集 
的 属性 的 数量 和 类 型 一 致 ，row-selector 指 定 游标 在 获取 下 一 个 满足 条 件 的 行 之 前 的 移动 模式 ， 
它 有 如 下 选项 : 


FIRST 

NEXT 

PRIOR 

LAST 
ABSOLUTE n 
RELATIVE n 


如 果 row-selector 指 定 为 NEXT， 游 标 移 向 结果 集 的 下 一 行 ， 同 时 该 行 的 值 被 存储 在 target- 
commalist 中 的 变量 里 ， 如 果 指 定 为 PRIOR， 游 标 移 向 前 一 行 ， 并 获取 这 一 行 的 值 。 与 此 类 似 ， 
FIRST 将 使 游标 指向 第 一 行 ， 而 LAST 使 游标 指向 最 后 一 行 。 最 后 ，ABSOLUTE "使 游标 指向 
表 中 的 第 x 行 ， 而 RELATIVE n 指 向 相对 当前 行 之 前 或 者 之 后 的 第 n 行 。 如 果 没 有 指定 row- 
selector， 那 么 默认 的 方式 是 NEXT。 如 果 是 默认 方式 并 且 GETENROLLED 使 用 上 面 的 ORDER 
BY 子 句 ， 那 么 会 按照 成 绩 的 升序 获取 每 行 。 

游标 声明 中 的 选项 SCROLL 的 含义 是 FETCH 语 名 可 以 使 用 任何 移动 模式 ; 如 果 设 有 指定 
SCROLL, ， 那 么 只 能 使 用 NEXT 移 动 模式 。 

图 10-6 中 对 图 10-4 进 行 扩充 ， 使 得 参加 某 门 课程 的 所 有 学 生 都 能 被 处 理 。 循 环 中 使 用 
FETCH 语 名 ， 循 环 在 FETCH 执 行 失败 时 终止 。 后 面 的 条 件 语 句 判 断 是 不 是 结果 集 的 所 有 行 
被 访问 过 ， 如 果 都 访问 过 ， 那 么 SQLSTATE 的 值 为 “02000”， 否 则 打印 出 错 信息 并 退出 程序 。 


#define OK "00000" 

#define EndOfScan "02000" 

EXEC SQL BEGIN DECLARE SECTION; 
unsigned long stud_id; 
char grade[1i]; 
char *crs_code; 
char *semester; 
char SQLSTATE [6] ; 

EXEC SQL END DECLARE SECTION; 


EXEC SQL DECLARE GETENROLLED INSENSITIVE CURSOR FOR 
SELECT T.StudId, T.Grade 
FROM TRANSCRIPT T 
WHERE T.CrsCode = :crs_code 
AND T.Semester = :semester 
FOR READ ONLY; 


... get values for crs_code, semester ... 


EXEC SQL OPEN GETENROLLED; 

if (stremp(SQLSTATE,OK) != 0) { 
printf("Can't open cursor\n"); 
exit(1); 





图 10-6 使 用 游标 扫描 一 张 表 
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EXEC SQL FETCH GETENROLLED INTO :stud_id, :grade; 
while (strcmp(SQLSTATE,OK) == 0) { 
... process the values in stud_id and grade .. 
- EXEC SQL FETCH GETENROLLED INTO :stud_id, :grade; 


if (stremp(SQLSTATE,EndOfScan) != 0) { 
printf ("Something fishy: error before end-of-scan\n"); 
exit (1); 

} 


EXEC SQL CLOSE GETENROLLED; 





10-6 (4%) 


10.2.5 服务 器 存储 过 程 


许多 DBMS 供 应 商 将 存储 过 程 (stored procedure) 作为 数据 库 模式 的 一 部 分 。 这 些 过 程 能 
被 客户 端 应 用 调用 并 在 服务 器 端 执行 。 存 储 过 程 有 如 下 的 优点 : 

* 由 于 存储 过 程 在 服务 器 端 执行 ， 因 此 只 需要 将 执行 结果 从 服务 器 端 传 到 客户 端的 应 用 程 
序 即 可 。 例 如 ， 一 个 存储 过 程 使 用 游标 访问 一 个 庞大 的 结果 集 并 分 析 得 出 一 个 值 ， 这 个 
值 被 传 给 应 用 程序 。 如 果 不 在 服务 器 端 运行 存储 过 程 而 让 应 用 程序 使 用 游标 ， 那 么 必须 

,将 这 个 庞大 的 结果 集 传 给 应 用 程序 进行 分 析 ， 这 势必 增加 通信 费用 和 响应 时 间 。 

“ 存储 过 程 中 的 SQL 语句 可 以 在 执行 应 用 程序 前 预备 ， 因 为 它 是 作为 模式 的 一 部 分 存储 在 

服务 器 端的 ， 而 马 入 式 SQL 语句 通常 都 是 在 运行 时 准备 的 。 因 此 即使 存储 过 程 仅 含有 一 
条 SQL 语句 ， 也 比 直接 伐 入 在 应 用 里 运行 效率 高 得 多 。 
在 14.6 节 中 说 过 ， 这 个 优点 在 某 些 情况 下 可 能 变 成 缺点 ， 因 为 查询 计划 会 变 得 越 来 越 陈 
旧 ， 因 此 ,“ 旧 ”的 存储 过 程 虽然 避免 了 查询 预备 的 开销 ， 但 却 由 于 低 效 和 过 时 的 查询 
计划 而 增加 运行 时 的 开销 。 一 些 供应 商 〈 例 如 Sybase) 提供 了 WITH RECOMPILE 选 项 ， 
可 以 在 调用 存储 过 程 的 时 候 指定 这 个 选项 ， 这 样 应 用 程序 就 能 定期 地 重新 编译 存储 过 
程 以 保证 查询 执行 计划 总 是 保持 最 新 状态 。 

“DBMS 可 以 在 存储 过 程 的 级 别 上 使 用 GRANT EXECUTE 语 句 对 授权 进行 检查 ，GRANT 
EXECUTE 对 4.3 节 介绍 的 GRANT 语句 进行 了 扩展 。 这 样 即 使 那些 没有 被 授权 允许 访问 
某 些 数据 库 关 系 的 用 户 也 可 能 被 授权 通过 执行 存储 过 程 来 访问 这 些 关 系 。 例 如 ， 注 册 事 
务 和 修改 成 绩 事务 可 以 通过 调用 使 用 SELECT 语句 的 存储 过 程 访 问 某 张 表 中 的 相同 行 ， 
但 是 一 个 存储 过 程 被 授权 给 学 生 ， 而 另 一 个 存储 过 程 被 授权 给 教职员 工 。 
另外 ， 存 储 过 程 能 超出 SQL GRANT 语 句 范围 控制 用 户 能 做 哪些 事 。 例 如 ， 存 储 过 程 可 
以 要 求 只 有 学 生 才 能 够 执行 为 自己 注册 的 事务 。 

* 应 用 程序 员 不 需要 知道 数据 库 模式 的 细节 , 因为 所 有 的 数据 库 访问 都 封装 在 存储 过 程 中 。 
例如 ， 注 册 办 公 室 可 以 提供 注册 事务 的 存储 过 程 ， 程 序 员 只 要 知道 如 何 调用 即 可 。 

“系统 的 维护 变 得 更 加 简单 ， 因 为 只 需要 对 服务 器 上 的 存储 过 程 的 拷贝 进行 维护 和 更 新 。 
相反 ， 如 果 将 存储 过 程 的 代码 包含 在 许多 不 同 的 应 用 程序 中 ， 那 么 这 些 代码 就 需要 同时 
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被 维护 和 更 新 。 

* 存储 过 程 代码 的 物理 安全 性 得 到 提高 ， 因 为 代码 被 放 在 服务 器 端 而 不 是 在 应 用 程序 中 。 

在 22.2.1 节 中 讨论 支持 存储 过 程 的 系统 体系 结构 的 时 候 会 进一步 说 明 这 些 优点 。 

最 初版 本 的 SQL-92 标 准 不 支持 存储 过 程 ， 这 种 支持 直到 1996 年 才 被 加 入 。 现 在 我 们 通过 
例子 来 说 明 存储 过 程 语言 。 

图 10-7 是 一 个 存储 过 程 的 DDL 声 明 ， 这 个 存储 过 程 用 于 注销 学 生 选 取 的 某 门 课程 。 这 里 
假设 在 调用 存储 过 程 之 前 应 用 程序 已 经 连接 到 DBMS ， 而 在 执行 存储 过 程 后 会 断 开 。 


CREATE PROCEDURE Deregister (IN crs_code CHAR(6), 
IN semester CHAR(6), 
IN student_id INTEGER, 
OUT status INTEGER, 
OUT statusMsg CHAR VARYING(100)) 


BEGIN ATOMIC 
DECLARE message CHAR VARYING (50) 
DEFAULT 'Houston, we have a problem: '; 
DECLARE Success INTEGER DEFAULT 0; 
DECLARE Failure INTEGER DEFAULT -1; 


IF 1 <> (SELECT COUNT(*) FROM CLASS C 
WHERE C.Semester = semester AND C.CrsCode = crs_code) 
THEN 
SET statusMsg = ‘Course not offered'; 
SET status = Failure; 
ELSE 
BEGIN -- Block limits the scope of error handler 
DECLARE UNDO HANDLER FOR SQLEXCEPTION 
BEGIN 
SET statusMsg = message || ‘cannot delete'; 
SET status = Failure; 
END 
DELETE FROM TRANSCRIPT 
WHERE StudId = student_id 
AND Semester = semester 
AND CrsCode = crs_code; 
END 
BEGIN -- Block limits the scope of error handler 
DECLARE UNDO HANDLER FOR SQLEXCEPTION 
BEGIN 
SET statusMsg = message || 'cannot update'; 
SET status = Failure; 
END 
UPDATE CLASS 
SET Enrollment = (Enrollment - 1) 
WHERE Semester = semester 
AND CrsCode = crs_code; 
END 
-- Normal termination 
SET status = Success; 
SET statusMsg = 'OK'; 
END IF; 
END; 





图 10-7 存储 过 程 : 注销 学 生 选 取 的 某 门 课程 
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这 个 过 程 是 使 用 SQL/PSM (SQL Persistent Stored Module ， 持 久 存储 模块 ) 语言 编写 的 ， 
符合 SQL-92 扩 展 标准 9。 这 个 标准 同时 规定 在 其 他 语言 (例如 C 语 言 ) 中 编写 存储 过 程 的 规范 。 
注意 ,SQL/PSM 仅 仅 是 另 一 种 宿主 语言 ，SQL 可 以 嵌入 其 中 。 示例 中 的 过 程 共有 3 个 输入 参数 ， 
用 关键 字 IN 标识 ， 同 时 有 两 个 输出 参数 ， 用 关键 字 OUT 标 识 。 标 准 也 支持 同时 作为 输入 和 和 输 
出 的 参数 ， 用 INOUT 标 识 。 

过 程 的 主体 包含 在 BEGIN/END 块 中 ， 选 项 ATOMIC 确 保 将 整个 块 将 作为 一 个 原子 单元 执 
行 。 接 下 来 是 一 组 变量 声明 ， 可 以 使 用 DEFAULT 语 句 〈 可 选 的 ) 指定 初始 值 。 注 意 ， 不 管 是 
参数 还 是 宿主 变量 〈 即 在 存储 过 程 中 声明 的 PSM 变 量 ) 都 没有 前 级 “: ”， 这 是 因为 SQL/PSM 
是 一 种 统一 语言 ， 其 编译 器 能 够 知道 哪些 语句 是 宿主 变量 声明 ， 哪 些 语句 是 控制 语句 ， 哪 些 
语句 是 SQL 查询 和 更 新 语句 。 这 个 例子 说 明 ， 变 量 既 可 以 在 查询 和 更 新 语句 之 中 使 用 ， 也 可 
以 在 查询 和 更 新 语句 之 外 使 用 。 特 别 要 指明 的 是 ， 它 们 的 值 可 以 通过 SET 子 名 设置 ， 并 且 可 
以 作为 算术 和 字符 串 表达 式 的 一 部 分 。 

PSM 是 一 个 功能 强大 的 成 熟 的 编程 语言 ， 可 以 与 SQL 完美 地 结合 起 来 。 这 里 只 是 简单 介 
绍 ， 有 许多 特征 没有 加 以 介绍 ， 例 如 循环 结构 、CASE 语 名 以 及 游标 等 等 。 有 关 PSM 和 存储 过 
程 的 详细 内 容 可 以 参阅 [Melton 1997]， 这 里 仅仅 介绍 PSM 的 错误 处 理 ， 它 与 能 和 人 式 SQL 稍 有 
不 同 。 

与 每 次 执行 更 新 语句 之 后 检查 变量 SQLSTATE (或 者 使 用 WHENEVER 语 句 ) 不 同 ， 在 
SQL/PSM 中 通过 声明 条 件 处 理 程 序 (condition handler) 处 理 SQLSTATE 的 不 同 值 。 条 件 处 理 
程序 是 一 个 程序 ， 在 SQL 语 句 执行 中 断后 如 果 SQLSTATE 的 值 与 某 个 条 件 处 理 程 序 相 关联 的 
值 匹配 ， 那 么 就 会 执行 这 个 条 件 处 理 程序 。 在 我 们 的 例子 中 有 两 个 处 理 程序 与 SQL 
EXCEPTION 相 关联 ， 它 是 可 以 匹配 任何 “错误 代码 ”〈 任 何不 以 00、01 和 02 开 头 的 
SQLSTATE 值 ) 的 条 件 。 每 个 处 理 程序 都 有 处 理 范围 ， 由 BEGIN/END 界 定 ， 这 样 就 可 以 将 不 
同 的 处 理 程 序 和 不 同 的 SQL 语句 联系 在 一 起 。 两 个 处 理 程序 的 类 型 都 是 UNDO ， 这 意味 着 
DBMS 在 执行 完 处 理 程 序 后 将 回 退 存储 过 程 的 结果 并 退出 。UNDO 类 型 的 处 理 程序 只 能 出 现 
在 BEGIN ATOMIC 模 块 中 。 另 外 ， 还 可 以 指定 CONTINUE 与 EXIT 类 型 的 处 理 程序 ， 前 者 在 执 
行 完 处 理 程序 后 继续 进行 似乎 没有 任何 错误 发 生 ， 而 后 者 在 执行 完 处 理 程 序 后 将 直接 退出 程 
序 并 且 不 会 回 退 存储 过 程 所 作 的 操作 。 

在 交互 式 SQL 中 (在 一 个 存储 过 程 中 )， 可 以 使 用 下 面 的 语句 调用 另外 一 个 存储 过 程 : 

CALL procedure_name (argument-commalist) ; 

在 戏 入 SQL 的 宿主 语言 中 ，CALL 语 名 前 要 加 EXE SQL。 这 时 ， 过 程 参 数 是 添加 前 级 “:” 的 
宿主 语言 变量 。 例 如 ， 调 用 DeregisterO 存 储 过 程 的 方式 是 : 

EXEC SQL CALL Deregister(:crs_code, :semester, :stud_id); 


其 中 crs_code、semester 和 stud_id 都 是 宿主 变量 。 
10.3 再 论 完整 性 约束 
一 个 一 致 的 事务 将 数据 库 从 初始 状态 变 到 最 终 状 态 ， 这 两 个 状态 都 满足 所 有 的 完整 性 约 


O 其 他 供应 商 在 此 之 前 开发 了 类 似 于 SQL/PSM 的 语言 ， 但 与 SQL/PSM 有 一 定 的 区 别 。 例 如 ，Oracle 使 用 
PL/SQL，Microsoft 和 Sybase 提供 Transact-SQL ， 而 Informix 提 供 SPL 语 言 。 
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束 。 但 是 事务 执行 过 程 中 的 一 个 中 间 状 态 却 可 能 违反 某 个 约束 。 例 如 ， 在 参照 完整 性 的 例子 
中 ， 如 果 对 行 的 引用 在 该 行 之 前 加 入 就 违反 了 约束 。 同 样 ， 图 10-7 中 的 过 程 Deregister 里 
DELETE 语 句 产生 的 状态 违反 下 列 完整 性 约束 ， 即 TRANSCRIPT 表 中 参加 某 门 课程 的 学 生 数 目 必 
须 与 CLAss 表 中 与 这 门 课程 对 应 的 字段 NuomEnrolled 值 相等 ， 如 果 DBMS 在 执行 完 每 条 语句 后 
立即 进行 约束 性 检查 ， 那 么 将 会 拒绝 执行 DELETE 操 作 。 

为 了 处 理 这 种 情况 ，SQL 允 许 应 用 控制 每 个 约束 的 模式 。 如 果 约 东 是 立即 模式 
(immediate mode)， 那 么 在 事务 中 执行 完 任何 一 条 可 能 违反 该 约束 的 SQL 语句 后 会 立即 检 
查 ; 如 果 约 束 是 延迟 模式 (deferred mode)， 那 么 直到 事务 请 求 提交 的 时 候 才 会 检查 该 约束 。 

© 如果 约 束 检查 是 立即 模式 并 且 某 个 SQL 语句 违反 该 约束 ， 那 么 该 语句 会 被 回 退 ， 而 且 相 
应 的 错误 代码 通过 SQLSTATE 和 返回。 事务 可 以 从 诊断 域 获得 被 违反 的 约束 的 名 称 。 

* 如 果 约 束 检查 是 延迟 模式 ， 那 么 直到 事务 请 求 提交 的 时 候 才 会 检查 约束 。 如 果 这 时 发 现 
违反 某 个 约束 ， 那 么 将 会 中 止 事务 并 返回 相应 的 错误 代码 。 因 此 如 果 完 整 性 约束 在 事务 
执行 的 过 程 中 会 被 违反 ， 那 么 显然 选择 延迟 模式 更 合适 。 

当 定 义 一 个 约束 的 时 候 ， 可 以 指定 不 同 的 选项 ， 例 如 一 个 表 约束 遵守 下 面 的 规则 : 
[CONSTRAINT constraint-name ] CHECK conditional-expression 


{ { INITIALLY DEFERRED | INITIALLY IMMEDIATE}] 
{ { DEFERRABLE | NOT DEFERRABLE } J 


第 一 个 选项 确定 约束 的 初始 模式 。 如 果 选 定 INITIALLY DEFERRED, ， 那 么 将 该 约束 设 为 延迟 
模式 ， 直 到 使 用 SET CONSTRAINT 语 名 重新 设 定 为 止 。 第 二 个 选项 确定 是 否 以 后 能 被 SET 
CONSTRAINT 语 句 设 定 为 延迟 模式 ， 显 然 NOT DEFERRABLE 和 INITIALLY DEFERRED 是 
相互 矛盾 的 ， 不 能 同时 使 用 。 

一 个 DEFERRABLE 约 束 可 以 在 不 同时 间 指 定 为 IMMEDIATE 和 DEFERRED。 通 过 使 用 下 
面 的 语句 可 以 在 立即 模式 和 延迟 模式 之 间 切 换 : 

SET CONSTRAINTS { constraint-list | ALL } { DEFERRED | IMMEDIATE } 


其 中 constraint-list 是 CONSTRAINT 语 名 中 指定 的 约束 的 名 称 列表 。 


10.4 动态 SQL 


在 编写 程序 的 时 候 设计 静态 SQL 并 将 它 嵌 入 到 应 用 程序 中 。 语 句 的 所 有 细节 信息 ， 例 如 
类 型 (SELECT，INSERT)、 模 式 信 息 〈 语 句 中 引用 的 属性 名 和 表 名 ) 以 及 作为 输入 输出 参数 
的 宿主 语言 变量 ， 在 编译 的 时 候 就 已 经 知道 。 

但 是 在 某 些 应 用 程序 里 ， 在 编写 的 时 候 不 一 定 知道 上 述 所 有 信息 。 为 了 处 理 这 种 情况 ， 
SQL-92 定 义 专门 的 语法 ， 通 过 包含 宿主 语言 程序 中 的 指令 (directive) 来 构造 、 预 备 和 执行 
SQL 语句 。 语 句 由 程序 的 宿主 语言 部 分 在 运行 时 构造 。 为 了 和 静态 SQL 区 别 ， 这 组 指令 被 称 
为 动态 SQL (dynamic SQL)， 它 的 另 一 个 含义 是 表示 SQL 语句 可 以 在 运行 时 动态 创建 。 和 静 
态 SQL 一 样 ， 指 令 使 用 语法 和 宿主 语言 相 区 别 ， 因 此 动态 SQL 也 是 语句 级 的 接口 。 由 于 静态 
和 动态 SQL 使 用 相同 的 语法 ， 因 此 能 被 相同 的 预 编 译 器 处 理 ， 一 个 应 用 程序 可 以 同时 包含 静 
态 和 动态 SQL 结构 。 
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构建 的 SQL 语句 在 程序 中 是 作为 字符 串 类 型 宿主 语言 变量 的 值 出 现 的 ， 在 运行 时 作为 动 
态 SQL 指 令 的 参数 传递 给 DBMS 做 预备 。 一 旦 预备 完毕 ， 就 可 以 执行 语句 。 和 静态 SQL 相同 ， 
语句 必须 使 用 DBMS 能 够 识别 的 专门 语言 加 以 构建 。 

假设 学 校 有 一 个 学 生 注 册 系 统 ， 学 生 可 以 利用 该 系统 在 任何 一 个 分 校 里 注册 任何 一 门 课 
程 。 同 时 假定 每 个 分 校 都 拥有 自己 的 课程 数据 库 ， 并 以 自己 的 习惯 来 命名 表 和 属性 。 当 一 个 
学 生 执 行 注册 的 时 候 ， 应 用 程序 就 会 创建 合适 的 SQL 语句 执行 在 指定 分 校 的 注册 。 例 如 ， 可 
以 将 每 个 分 校 相 应 的 SELECT 语句 以 字符 串 的 形式 存储 在 文件 里 ， 在 运行 的 时 候 获 取 相 应 的 字 
符 串 并 赋值 给 宿主 语言 变量 ， 从 而 预备 并 执行 。 程 序 也 可 以 使 用 合适 的 SQL 语句 框架 ， 提 前 
预备 ， 在 运行 的 时 候 填充 合适 的 表 名 和 属性 名 即 可 。 

上 面 的 例子 中 ， 在 模式 和 在 所 有 分 校注 册 某 学 生 的 SQL 语 句 之 间 有 某 些 共同 点 ， 因 此 应 
用 程序 知道 将 要 执行 的 SQL 语句 的 某 些 信息 。 再 举 一 个 例子 ， 某 个 应 用 监控 着 终端 ， 人 允许 用 
户 输入 任意 的 SQL 语句 在 某 个 数据 库 管 理 器 上 执行 。 现 在 ， 应 用 程序 没有 将 要 送 往 数 据 库 执 
行 的 SQL 语句 的 任何 信息 ， 仅 仅 将 这 个 字符 串 赋值 给 变量 并 将 它 传递 给 DBMS 进 行 处 理 。 类 
似 地 ， 考 虑 将 电子 数据 表格 与 数据 库 相 连 的 一 个 应 用 。 运 行 的 时 候 ， 用 户 指定 电子 数据 表格 
的 某 项 的 值 包含 数据 库 项 目 ， 这 些 项 目 必 须 通过 查询 的 方式 的 到 。 查 询 可 以 由 用 户 通过 图 形 
符号 的 方式 表达 ， 应 用 程序 将 这 些 符号 转换 成 SELECT 语句 。 同 样 ， 这 里 没有 将 要 执行 的 SQL 
语句 的 信息 ， 也 没有 语句 所 要 访问 的 数据 库 模式 的 信息 。 

缺乏 信息 会 导致 一 个 问题 ， 因 为 必须 知道 SQL 语句 输入 输出 参数 的 域 才 能 确定 宿主 语言 
变量 的 合适 类 型 ， 以 便 传递 参数 。 在 应 用 程序 编译 的 时 候 不 能 获得 信息 的 情况 下 ， 动 态 SQL 
提供 指令 允许 程序 在 运行 的 时 候 查询 DBMS 以 获得 模式 信息 。 


10.4.1 动态 SQL 的 语句 预备 
下 面 的 示例 说 明 如 何 动态 创建 SQL 语句 2 : 


printf ("Which column of CLAss would you like to see? ") ; 
scanf("%s", column); // get user input (Enrollment or Room) 
// Incorporate user input into SQL statement 
sprintf (my_sql_stmt, 

"SELECT C.%s FROM CLASS C \ 

WHERE C.CrsCode = ? AND C.Semester = 7", 

column) ; 
EXEC SQL PREPARE sti FROM :my_sql_stmt; 
EXEC SQL EXECUTE sti 

INTO :some_string_var 

USING :crs_code, :semester ; 


这 里 除了 CrsCode 和 Semester 的 值 在 编译 的 时 候 不 知道 外 ，SELECT 的 确切 形式 也 不 是 很 清楚 ， 
因为 查询 检索 的 列 依赖 于 用 户 在 运行 时 的 输入 。PREPARE 语 句 将 存储 在 变量 my_sql_stmt 中 的 
查询 字符 串 传递 给 数据 库 管理 器 进行 预备 ， 并 将 预备 语句 命名 为 st1 。 注 意 ， 这 里 st1 是 一 个 
SQL 变量 〈 只 能 用 在 SQL 语句 中 ) 而 不 是 宿主 语言 变量 ， 因 此 前 面 没有 “: ”前 组 。 


O ”对 C 不 太 熟 悉 的 读者 可 以 在 这 里 得 到 帮助 。 函 数 scanf(O 读 取 用 户 的 输入 并 将 结果 赋 给 变量 column。 SELECT ` 
语句 中 的 反 斜 线 表 明 下 一 行 是 这 一 行 的 继续 。 函 数 sprintfO 使 用 变量 column 的 值 替 换 %s， 最 后 将 结果 赋 给 
变量 my_sql_stmt 。 
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EXECUTE 语 句 执行 语句 st1。 这 个 字符 串 包含 两 个 输入 参数 ， 用 “?” 标 识 ， 这 些 参 数 将 
用 USING 子 句 里 的 宿主 语言 变量 的 值 来 替换 。 另 外 ，INTO 子 句 里 的 宿主 变量 用 来 接收 结果 。 
标记 “?” 被 称 为 动态 参数 (dynamic parameter) 或 者 占 位 符 (placeholder)， 可 以 用 在 
SELECT、INSERT、UPDATE 以 及 DELETE 语 句 中 。 一 有 旦 预备 完毕 ，st1 可 以 执行 多 次 ， 并 使 
用 不 同 的 宿主 语言 变量 作为 参数 。PREPARE 语 名 生成 的 查询 执行 计划 用 于 当前 会 话 中 所 有 后 
续 的 执行 中 。 

注意 ， 与 SELECT INTO 一 样 ，EXECUTE INTO 要 求 查询 结果 为 一 行 。 如 果 结 果 包 含 多 
行 ， 就 必须 使 用 游标 而 不 能 再 使 用 EXECUTE INTO。 关 于 动态 SQL 语句 里 的 游标 将 在 10.4.3 
Witte. 

动态 SQL 中 的 参数 传递 与 静态 SQL 里 的 参数 传递 是 不 相同 的 ， 它 使 用 占 位 符 而 不 是 宿主 
语言 变量 名 称 执行 预备 ， 并 且 INTO 子 句 是 和 EXECUTE 语 句 联系 在 一 起 而 不 是 和 SELECT 语 铝 
联系 在 一 起 。 为 什么 参数 传递 不 同 呢 ? 

"在 静态 SQL 里 ，WHERE 和 INTO 子 句 中 的 宿主 语言 变量 名 称 是 作为 参数 提供 给 预 编译 器 。 

预 编 译 器 在 编译 的 时 候 分 析 这 些 子 句 ， 这 些 变量 在 编译 器 的 符号 表 中 加 以 描述 ， 符 号 表 
用 于 将 变量 名 转换 成 地 址 (回忆 一 下 ，DECLARE SECTION 中 声明 可 以 同时 被 预 编 译 
费 和 宿主 语言 编译 器 处 理 )。 符 号 表 中 的 项 包含 变量 名 和 地 址 间 的 映射 以 及 类 型 信息 ， 
这 个 类 型 信息 被 预 编 译 器 用 来 生成 数据 库 里 的 数据 和 这 些 变 量 之 间 转 换 的 代码 ， 在 宿主 
语言 程序 里 执行 SQL 语句 的 时 候 执行 这 个 代码 。 

“在 动态 SQL 里 ， 正 如 示例 所 示 ， 编 译 器 可 能 得 不 到 SQL 语句 ， 因 此 如 果 宿 主语 言 变 量 作 

为 参数 嵌 人 到 语句 中 ， 就 不 能 使 用 符号 表 中 的 信息 来 处 理 这 些 参数 。 为 了 能 够 在 编译 的 
时 候 获 得 参数 信息 ， 有 两 种 可 选择 的 方法 ， 一 种 方法 是 通过 SCLD4 机 制 ， 这 将 在 稍 后 讨 
论 ; 另 一 种 方法 是 像 示例 所 示 那 样 使 用 USING 和 INTO 子 句 提 供 输 入 输出 变量 。 对 于 后 
者 ， 预 编译 器 生成 代码 在 这 些 变量 中 存 取 参 数 的 值 从 而 和 DBMS 通 信 。 

应 用 程序 应 该 尽 可 能 地 使 用 静态 SQL 设计 ， 因 为 动态 SQL 的 效率 通常 比较 低 。 将 预备 和 
执行 分 隔 开会 增加 通信 和 处 理 的 开销 。 如 果 语 句 多 次 执行 ， 增 加 的 开销 会 分 摊 到 每 次 执行 中 
去 ， 因 为 预备 只 需要 做 一 次 。 另 外 ， 在 某 些 情况 下 可 以 避免 这 个 开销 。 例 如 ， 对 于 那些 只 需 
要 执行 一 次 的 SQL 语句 ， 可 以 通过 EXECUTE IMMEDIATE 指 令 将 预备 和 执行 绑 定 在 一 起 。 : 

EXEC SQL EXECUTE IMMEDIATE 

‘INSERT INTO TRANSCRIPT ' 
|| ‘VALUES ("656565656", "CS315", "F1999", "C")'; 

更 常见 的 情况 是 ，SQL 语 名 可 以 被 放 在 一 个 宿主 语言 的 字符 串 变 量 中 ， 这 时 EXECUTE 
IMMEDIATE 语 名 的 形式 如 下 : 

EXEC SQL EXECUTE IMMEDIATE :my_sql_stmt; 


注意 ， 变 量 my_sql_stmt 前 有 符号 “:”， 前 面 介绍 过 ， 这 表示 my_sqlL_stmt 是 宿主 语言 变量 而 不 


O 注意 字符 串 的 处 理 。INSERT INTO 是 动态 SQL 语句 的 一 部 分 ， 因 此 我 们 使 用 单 引号 标识 字符 串 。 由 于 语句 
太 长 ， 所 以 被 分 为 两 个 字符 串 ， 并 使 用 SQL 里 常用 的 连接 符 “IP 连接 。 要 在 字符 串 中 包含 引用 符号 ， 它 必 
须 用 双 引号 ， 例 如 “656565656” 。 这 使 得 SQL 分 析 器 能 够 正确 的 解析 字符 串 。 最 终 每 个 双 引 号 (“) 被 单 
引号 代替 ， 从 而 生成 正确 的 SQL 语句 。 
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是 SQL 变量 。 

EXECUTE IMMEDIATE 仅 仅 是 将 PREPARE 和 EXECUTE 语 句 绑 定 在 一 起 的 快捷 方式 ， 并 
且 在 语句 执行 完 后 并 不 保存 执行 计划 。 这 个 快捷 方式 强加 了 一 些 语 法 限制 ， 不 允许 使 用 某 些 
逻辑 。 例 如 它 不 允许 有 INTO 子 句 ， 央 此 不 能 有 输出 参数 (也 就 是 不 能 检索 数据 ) ， 即 不 能 使 
用 SELECT 语句 。 

EXECUTE IMMEDIATE 也 不 允许 使 用 USING 子 句 ， 不 过 这 个 限制 并 不 很 严格 。 
EXECUTE 语 名 使 用 USING 的 原因 是 一 且 语 句 预备 结束 (其 中 动态 输入 参数 标记 为 ? )， 那 么 
就 可 以 执行 多 次 而 每 次 使 用 不 同 的 输入 参数 。 因 为 EXECUTE IMMEDIATE 在 一 步 中 就 将 预备 
和 执行 完成 (而 且 不 需要 保存 预备 语句 )， 因 此 是 不 需要 动态 参数 的 ， 我 们 可 以 通过 宿主 语言 
将 合适 的 参数 值 伐 入 到 SQL 语 名 中 ， 然 后 将 创建 好 的 完整 语句 传递 给 EXECUTE 
IMMEDIATE. . . 

同 静 态 SQL 一 样 ，SQLSTATE 用 来 返回 PREPARE、EXECUTE、EXECUTE IMMEDIATE 


语句 和 其 他 动态 SQL 语句 的 状态 。 
10.4.2 预备 语句 和 描述 符 区 


虽然 10.4.1 节 的 示例 中 查询 是 在 运行 时 创建 的 , 而 且 输 出 列 的 名 字 在 编译 的 时 候 并 不 知道 ， 
但 是 这 个 例子 仍然 比较 简单 的 ， 因 为 程序 知道 查询 目标 列表 只 含有 一 个 属性 名 并 且 知 道 
WHERE 子 句 有 两 个 动态 参数 。 知 道 输入 输出 参数 的 个 数 就 可 以 使 用 EXECUTE 语 句 并 为 
USING 和 INTO 子 句 提 供 具体 的 变量 名 。 这 时 ， 预 编译 器 可 以 提供 自动 格式 转化 。 例 如 ， 如 时 
用 户 输入 Enrollment 的 类 型 为 整 型 ， 而 预 编 译 器 确定 INTO 变 量 的 类 型 是 字符 串 型 ， 所 以 需要 
自动 转换 为 字符 串 型 。 因 为 DBMS 在 运行 时 提供 SELECT 语句 返回 值 的 类 型 ， 所 以 转换 要 到 那 
个 时 候 才 确定 。 | 

现在 假设 在 运行 时 用 户 可 以 指定 目标 列表 中 属性 的 个 数 和 WHERE 从 句 中 的 条 件 ， 这 样 在 
设计 时 就 不 知道 输入 和 输出 的 个 数 ， 因 此 也 就 不 能 使 用 10.4.1 节 的 EXECUTE 语 句 形式 ， 因 为 
在 编写 程序 的 时 候 不 知道 要 在 INTO 和 USING 子 句 中 提供 多 少 个 变量 。 

为 了 处 理 这 种 情况 ， 动 态 SQL 提 供 了 一 种 运行 时 机 制 ， 通 过 这 种 机 制程 序 可 以 从 DBMS 中 
请 求 语句 参数 的 描述 信息 。 例 如 ， 程 序 允 许 用 户 查询 数据 库 中 的 任意 一 个 只 有 一 行 的 关系 : 

printf ("Which table would you like to inspect? "); . 

scanf ("%s", table); // get user input (e.g., Class or Transcript) 

// Incorporate user input into SQL statement 

sprintf (my_sql_stmt, 


"SELECT * FROM %s WHERE COUNT(*)=1", 
table); 


这 条 语句 没有 输入 参数 ， 但 是 输出 参数 的 个 数 不 确 定 ， 因 为 预先 不 知道 FROM 子 句 使 用 的 表 ， 
所 以 也 就 不 知道 SELECT 语句 中 的 “* ”表示 多 少 个 表 属 性 〈 即 输出 参数 )。 虽 然 对 这 些 参数 一 
无 所 知 ， 但 是 一 旦 语句 预备 完毕 ，DBMS 就 可 以 知道 所 有 的 信息 ， 并 将 这 些 信息 提供 给 程序 ， 
它 是 通过 描述 符 区 来 完成 的 。 应 用 程序 首先 要 求 DBMS 分 配 一 个 描述 符 区 (descriptor area), 


”日 这 个 例子 中 使 用 EXECUTE 语 句 ， 它 能 处 理 只 有 一 行 的 查询 。 对 于 一 般 的 情况 ， 可 以 使 用 游标 和 FETCH 请 
句 。 将 在 下 一 节 讨 论 动态 SQL 中 的 游标 。 
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有 时 候 也 被 称 作 SQLDA ,参数 的 信息 就 存储 在 这 个 空间 里 。 当 语句 预备 完毕 后 ， 应 用 程序 可 
以 请 求 DBMS 将 参数 信息 填充 到 这 个 描述 符 区 中 。 对 于 上 面 的 例子 ， 可 以 按 如 下 方式 填充 描 
述 符 区 : 

EXEC SQL PREPARE st FROM :my_sqi_stmt; 

EXEC SQL ALLOCATE DESCRIPTOR 'st_output' WITH MAX 21; 

EXEC SQL DESCRIBE OUTPUT st 

USING SQL DESCRIPTOR ‘st_output'; 

这 里 st_output 是 SQL 变量 ， 用 于 命名 已 分 配 的 描述 符 区 。ALLOCATE DESCRIPTOR 语 句 在 数 
据 库 管理 器 中 创建 最 多 能 够 描述 21 个 参数 的 空间 (由 WITH MAX 指 定 )。 描 述 符 区 可 以 视 为 
由 一 个 一 维 数组 加 上 一 个 记录 实际 参数 个 数 的 变量 组 成 的 。 每 一 项 都 有 固定 结构 ， 这 些 结构 
由 一 组 描述 特定 参数 的 部 分 组 成 ， 这 些 特定 参数 包括 名 称 、 类 型 ， 以 及 值 。 所 有 字段 最 初 都 
没有 定义 。DESCRIBE 语 名 告诉 DBMS 将 预备 语句 st (包含 名 称 、 类 型 和 参数 的 长 度 ) 的 第 i 
个 输出 参数 的 元 信息 填充 到 描述 符 st_output 的 第 i 个 项 中 ， 同 时 将 参数 的 个 数 记 录 在 描述 符 中 。 

现在 回 到 我 们 的 例子 当中 ， 程 序 使 用 下 面 的 指令 执行 预备 好 的 语句 st: 


EXEC SQL EXECUTE st 
INTO SQL DESCRIPTOR 'st_output'; 


它 将 返回 行 的 第 个 属性 的 值 存储 在 st_output 的 第 i 项 中 。 程 序 可 以 用 GET DESCRIPTORS 4 
在 循环 中 依次 访问 返回 行 的 每 个 字段 获得 属性 以 及 值 等 元 信息 ， 参 考 图 10-8。 最 后 ， 程 序 调 
用 DEALLOCATE DESCRIPTOR 来 释放 st_output 占 用 的 空间 。 

实际 上 ，SQL 语 句 执行 时 输入 参数 的 个 数 不 确 定 的 情况 是 很 少见 的 。 如 果 遇 到 这 种 情况 ， 
程序 可 以 使 用 ALLOCATE 和 DESCRIBE INPUT 为 占 位 符 “?” 标 识 的 输入 参数 创建 描述 符 区 。 
和 前 面 一 样 ， 这 个 描述 符 区 是 一 个 数组 ， 每 一 项 对 应 着 一 个 占 位 符 。 然 后 程序 使 用 
DESCRIBE INPUT 语 句 请 求 DBMS 用 每 个 输入 参数 的 类 型 、 长 度 以 及 名 称 等 信息 填充 描述 符 
区 。 这 时 需要 使 用 SET DESCRIPTOR 语 句 提 供 参 数值 。 对 具体 的 细节 有 兴趣 的 读者 可 以 参考 
SQL 手册 ， 例 如 [Date and Darwen 1997, Melton and Simon 1992]。 


int collength, coltype, colcount; 
char colname [255]; 
// arrange variables for different types of data 
char stringdata[1024]};; 
int intdata; 
float floatdata; 
. variable declarations for other types ... 
// Store the number of columns in colcount 
EXEC SQL GET DESCRIPTOR ‘st_output' :colcount = COUNT; 
for (i=0; i < colcount; i++) { 
// Get meta-information about the ith attribute 
// Note: type is represented by an integer constant, such as 
// SQL CHAR, SQL_INTEGER, SQL_FLOAT, defined in a header file 
EXEC SQL GET DESCRIPTOR 'st_output' VALUE :i 
:coltype = TYPE, | 
:collength = LENGTH, 
:colname = NAME; 





图 10-8 使 用 GET DESCRIPTOR 的 例子 
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printf("Column %s has value: ", colname); 
switch (coltype) { 
case SQL_CHAR: 
EXEC SQL GET DESCRIPTOR 'st_output' VALUE :i :stringdata = DATA; 
printf ("%s\n", stringdata); // print string value 
break; 
case SQL INTEGER: 
EXEC SQL GET DESCRIPTOR 'st_output' VALUE :i :intdata = DATA; 
printf ("%d\n", intdata); // print integer value 
break; 
case SQL_FLOAT: 
EXEC SQL GET DESCRIPTOR 'st_output' VALUE :i :floatdata = DATA; 
printf("4f\n", floatdata); // print floating point value 
break; / 
. other cases ... 
} // switch 
} // for loop 





图 10-8 (4) 


10.4.3 游标 


与 SELECT INTO 相 同 ，EXECUTE INTO 也 要 求 查询 结果 必须 是 单行 的 ， 而 在 一 般 情 况 下 
查询 结果 都 为 多 行 ， 这 时 需要 使 用 游标 机 制 去 扫描 。 幸 运 的 是 ， 和 静态 SQL 一 样 ， 在 动态 
SQL 中 可 以 为 预备 语句 定义 游标 ， 尽 管 语法 稍 有 不 同 。 例 如 ， 下 面 这 个 例子 是 和 图 10-4 中 的 
程序 等 价 的 〈 为 了 简便 ， 本 例 中 没有 加 入 状态 检查 ): 


my_sql_stmt = "SELECT T.StudId, T.Grade \ 

FROM Transcript T \ 

WHERE T.CrsCode = 7 \ 

AND T.Semester = ?"; 
EXEC SQL PREPARE st2 FROM :my_sql_stmt; 
EXEC SQL DECLARE GETENROLL INSENSITIVE CURSOR FOR st2; 
EXEC SQL OPEN GrTENROLL USING :crs_code, :semester; 
EXEC SQL FETCH GETENROLL INTO :stud_id, :grade; 
EXEC SQL CLOSE GETENROLL; 


与 静态 SQL 里 的 游标 相同 ，DECLARE CURSOR 语 句 有 INSENSITIVE 和 SCROLL 选 项 ; 
FETCH 语 句 允许 为 可 卷 的 游标 指定 row-selector; UPDATE 和 DELETE 语 名 可 以 通过 非 
INSENSITIVE 类 型 的 游标 执行 。 


10.4.4 服务 器 端的 存储 过 程 
一 些 DBMS 人 允许 使 用 动态 SQL 调 用 存储 过 程 ， 下 面 的 示例 调用 了 图 10-7 中 的 存储 过 程 : 


my_sql_stmt = "CALL Deregister(?,?,7)"; 
EXEC SQL PREPARE st3 FROM :my_sql_stmt; 
EXEC SQL EXECUTE st3 

USING :crs_code, :semester, :stud_id; 


PREPARE 语 句 准 备 调用 Deregister 存 储 过 程 ， 而 EXEC SQL EXECUTE 语 句 调用 存储 过 程 并 提 
供 宿主 语言 的 变量 的 值 作 为 参数 。 
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10.5 JDBC#ISQLJ 


IDBC® 是 数据 管理 器 的 一 组 API， 提 供 在 Java 程 序 中 执行 SQL 语句 的 调用 级 接口 。 和 动态 
SQL 一 样 ， 在 运行 时 ，SQL 语 句 可 以 作为 字符 串 变 量 的 值 创 建 。JDBC 由 SUN 公 司 开 发 ， 是 
Java 语 言 的 一 部 分 。 

而 SQLJ 是 Java 程 序 的 声明 级 接口 ， 类 似 于 静态 嵌入 式 SQL， 不 同 于 JDBC 的 是 ，SQLJ 是 
由 各 公司 的 联盟 开发 的 ， 已 经 成 为 一 个 独立 的 ANSI 标 准 。 

JDBC 和 SQLJ 都 用 来 通过 因特网 访问 数据 库 ， 比 其 他 各 种 嵌入 式 或 者 动态 SQL 更 具 可 移 
植 性 。 


10.5.1 JDBC 的 基本 概念 


回忆 一 下 ， 在 动态 SQL 和 静态 SQL 里 ， 必 须 在 编译 的 时 候 知道 目标 DBMS ， 因 为 SQL 语句 
要 使 用 它 的 专用 语言 。 对 于 动态 SQL 而 言 ， 在 编译 的 时 候 可 以 不 知道 模式 。 而 JDBC 在 编译 的 
时 候 既 不 需要 知道 DBMS ， 也 不 需要 知道 模式 。 应 用 程序 使 用 DBC 的 SQL 专用 语言 ， 而 与 所 
使 用 的 DBMS 无 关 。 和 动态 SQL 一 样 ，IDBC 提 供 相应 的 功能 允许 程序 运行 时 向 DBMS 请 求 关 
于 模式 的 信息 。 

图 10-9 显 示 在 运行 的 时 候 JDBC 处 理 不 同 DBMS 的 机 制 。 应 用 程序 通过 驱动 程序 管理 器 
(driver manager) 模块 与 DBMS 通 信 。 当 应 用 程序 第 一 次 连接 到 某 个 DBMS 的 时 候 ， 驱 动 程序 
管理 器 选择 某 个 驱动 程序 ( 即 一 个 JDBC 模 块 ) 去 执行 以 下 的 操作 : 将 SQL 语句 从 JDBC 的 
SQL 专用 语言 转换 成 DBMS 的 专用 语言 。JDBC 为 常用 的 DBMS 保 留 专门 的 驱动 程序 。 驱 动 程 
序 管理 器 针对 需要 访问 的 DBMS 选 择 相应 的 驱动 程序 。 当 执行 SQL 语 名 的 时 候 ， 应 用 程序 将 
表示 该 条 语句 的 字符 串 发 给 相应 的 驱动 程序 ， 驱 动 程序 经 过 必要 的 转化 后 将 语句 传 给 DBMS ， 
语句 在 DBMS 中 进行 预 处 理 并 执行 。 


| | 驱动 程序 ”， 
应 用 程序 管理 器 | 
PIES 309) 
| 
图 10-9 通过 JDBC 连 接 数 据 库 


JDBC 的 软件 体系 结构 由 一 组 预先 定义 的 类 组 成 ， 例如 DriverManager 和 Statement， 这 些 
对 象 类 的 方法 提供 数据 库 的 调用 级 接口 。JDBC 程 序 必须 首先 装 火 这 些 预先 定义 的 类 ， 接着 创 
建 对象 类 型 的 相应 实例 ， 最 后 调用 合适 的 方法 访问 数据 库 。 图 10-10 显 示 Java 程 序 调用 JDBC 的 
一 般 框架 ， 下 面 逐 一 进行 解释 : 

e import java.sql.* 导 入 包 java.sql 中 的 所 有 类 ， 使 得 Java 程 序 可 以 调用 JDBC API。 图 中 出 






驱动 程序 1 


驱动 程序 3 ， 





O JDBC 是 Sun 公 司 的 商标 ， 虽然 SUN 声 称 JDBC 不 是 缩写 ， 然而 通常 认为 它 代表 Java 数 据 库 连接 (Java 


Database Connectivity ) 。 
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现 的 类 Connection 、Statement、DriverManager 和 Result 都 在 这 个 包 里 ， 其 他 的 类 
PreparedStatement、CallableStatement、 ResultSetMetadata 和 SQLException 也 在 这 个 包 +, 
中 CallableStatement 是 PreparedStatement 的 子 类 ， 而 PreparedStatement 是 Statement 的 子 类 。 

e Class forName() 装 和 人 指定 的 数据 库 驱 动 程序 ， 并 在 驱动 程序 管理 器 中 注册 。 虽 然 命 名 方式 
不 是 很 直观 ， 但 是 在 包 java.lang package 中 确实 包含 一 个 名 为 Class 的 类 ， 它 提供 在 运行 时 
装 入 某 个 类 的 方法 。forName0O) 是 它 的 一 个 静态 方法 ， 用 来 装 入 和 注册 指定 的 驱动 程序 。 
如 果 应 用 程序 想 连接 到 多 个 数据 库 ， 那 么 可 以 为 每 个 数据 库 单独 调用 Class.froName() 方 法 。 


import java.sql.*; 


String url,userId,password; 
Connection cont; 


// use the right driver for your database 
Class. forName("sun.jdbc.odbc.JdbcOdbcDriver"); // load the driver 
coni = DriverManager.getConnection(url, userId, password); 
} catch (ClassNotFoundException e) { 
System.err.println("Can't load driver\n") ; 
System.exit(1); 


} catch (SQLException e) { 
System.err.println("Can't connect\n"); 
System.exit(1); 


} . 
Statement stati = coni.createStatement(); // create a statement object 
String myQuery = ...some SELECT statement... 
ResultSet res1 = stati.executeQuery (myQuery) ; 

... process results ... 
stat1.close(); // free up the statement object 
conl.close(); // close connection 





图 10-10 JDBC 的 过 程 调用 框架 


这 条 语句 和 下 一 条 语句 包含 在 try/catch 结 构 中 ， 该 结构 用 来 处 理 异常 。 我 们 将 在 
10.5.5$ 节 中 再 讨论 异常 处 理 。 

。DriverManager.getConnection() 使 用 DriverManager 类 的 静态 方法 getConnection() 连 接 给 
定 地 址 的 DBMS。 这 个 方法 测试 每 个 已 经 装 入 的 数据 库 驱 动 程序 是 否 能 连接 到 那个 
DBMS。 如 果 可 以 的 话 ， 那 么 : 

1) 使 用 指定 的 用 户 ID 和 密码 建立 连接 。 

2) 创建 一 个 Connection 对 象 ， 并 将 它 赋 给 先前 声明 的 变量 con1。 

参数 url 含 有 目标 DBMS 的 URL (统一 资源 定位 符 ，Uniform Resource Locator)。 这 
个 URL 是 从 数据 库 管 理 员 那里 获得 的 。 例 如 : 


jdbc:odbc:http://server.xyz.edu/sturegDB:8000 


前 缀 jdbc 指 定 连 接 数据 库 的 主 协议 ( 毫 无 疑问 就 是 IDBC )。 第 二 部 分 odbc 指 定子 协议 
( 跟 供应 商 和 驱动 程序 有 关 )。 接 下 来 的 一 部 分 就 是 数据 库 服 务 器 的 地 址 ，8000 是 服务 
器 监听 的 通信 端口 号 。 
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* con! .createStatement(O) 使 用 Connection 对 象 con1 的 方法 createStatement(O) 来 生成 Statement 
对 象 并 将 它 赋 给 Statement 的 变量 stat1 。 

。statl.executeQuery() 使 用 Statement 对 象 stat1 预 处 理 并 执行 作为 参数 的 SELECT 语句 。 
SQL 语句 可 以 没有 输入 参数 ， 返 回 的 结果 集 存 储 在 ResultSet 对 象 res1 中 ， 它 是 由 
executeQuery() 方 法 创建 的 。 这 个 方法 类 似 于 动态 SQL 中 的 EXECUTE IMMEDIATE 指 令 ， 
因为 它 也 是 将 预备 和 执行 绑 定 在 一 起 完成 。 不 同 之 处 在 于 ，JDBC 方 法 为 返回 数据 创建 
了 一 个 对 象 ， 而 EXECUTE IMMEDIATE 没 有 这 样 做 。 在 10.5.3 节 中 将 讨论 ResultSet 类 。 

要 执行 UPDATE、DELETE、INSERT 语 句 或 者 DDL 语 句 ， 可 以 使 用 如 下 所 示 的 
形式 : 
statl.executeUpdate(- - .some SQL statement ---); 
这 个 函数 返回 一 个 整数 ， 表 明 有 多 少 条 记录 受到 影响 ， 对 于 CREATE 这 样 的 DDL 语 句 返 
回 的 是 0。 

。statl.close(0 和 conl.close(0 分 别 释放 Statement 对 象 和 Connection 对 象 〈( 断 开 连 接 )。 当 执 
行 完 一 条 语句 以 后 ，Statement 对 象 可 以 不 关闭 以 执行 另 一 条 语句 。 


10.5.2 预 处 理 语句 


图 10-10 调 用 的 executeQuery() 和 executeUpdate() 会 预 处 理 并 执行 指定 的 语句 ， 为 了 将 预 
处 理 和 执行 分 开 ， 可 以 先 调 用 


PreparedStatement psi = 
con1.prepareStatement (.. .SQL preparable statement - - -) ; 


返回 一 个 PreparedStatement 对 象 给 ps1 ， 然 后 调用 . 


ResultSet resl = psl.executeQuery(); 


或 者 


int n = ps1.executeUpdate(); 


这 里 executeUpdate( 返 回 一 个 整数 ， 表 明 对 多 少 行进 行 了 更 新 。， . 
PreparedStatement 是 Statement 类 的 子 类 。 注 意 ， 这 两 个 类 都 有 executeQuery() 方 法 和 
executeUpdate() 方 法 ， 但 是 PreparedStatement 的 方法 没有 参数 。 
与 动态 SQL 相同 ，prepareStatement() 的 字符 串 参 数 可 以 包含 占 位 符 “?” 标 识 的 动态 输入 
参数 ， 并 且 在 执行 前 必须 为 占 位 符 指定 一 个 具体 值 。 这 可 以 使 用 setXXX() 方 法 完成 。 例 如 : 


psi.setInt(1, someIntVar) ; 


会 用 宿主 语言 变量 someIntVar 的 值 替换 第 一 个 占 位 符 。PreparedStatement 类 有 一 组 setXXX( 方 
法 ，XXX 表 示 不 同类 型 的 输入 参数 ， 例 如 Int、Long 和 String 等 。 


10.5.3 结果 集 和 游标 


执行 查询 语句 后 会 将 结果 (输出 参数 ) 的 值 存储 在 ResultSet 对 象 中 ， 可 以 通过 游标 检索 
结果 集 的 行 。 JDBC 游 标 通过 ResultSet 类 的 方法 next0 〇 实现 ， 调用 ResultSet 对 象 的 时 候 ， 它 会 
依次 扫描 整个 集合 。 在 图 10-11 里 ， 结 果 集 对 象 存储 在 变量 res2 中 ，res2.next0) 方 法 将 游标 向 前 
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移动 一 行 。 


import java.sql.*; 


Connection con2; 
try { 
// Use appropriate URL and JDBC driver 
String url = "jdbc:odbc:http://server.xyz.edu/sturegDB: 800"; 
Class.forName("sun. jdbc.odbc. JdbcOdbcDriver") ; 
con2 = DriverManager.getConnection(url, "pml", "36.ty"); 
} catch ... // catch exceptions 


// Use the "+" operator, for readability 
String query2 = "SELECT T.StudId, T.Grade " + 
"FROM TRANSCRIPT T " + 
"WHERE T.CrsCode = ?了 " + 
"AND T.Semester = ?"; 


PreparedStatement ps2 = con2.prepareStatement (query2) ; 
ps2.setString(1, "CS308"); 

ps2.setString(2, "F2000"); 

ResultSet res2 = ps2.executeQuery(); 


long studId; 
String grade; 
while (res2.next()) { 
studId = res2.getLong("StudId") ; 
grade = res2.getString("Grade") ; 
... process the values in studId and grade ... 
} 


ps2.close(); 
con2.close() ; 





图 10-11 在 JDBC 程 序 中 使 用 游标 


程序 先 预 处 理 查询 ， 提 供 参 数 ， 然 后 执行 查询 ， 接 着 使 用 while 循 环 检索 结果 集 的 行 。 
next() 方 法 移动 游标 ， 当 没有 记录 返回 的 时 候 返 回 false。 在 while 循 环 的 每 次 迭代 中 调用 
getLong0 和 getStringO 检 索 结 果 行 ， 有 两 种 方式 ， 一 种 方式 是 以 属性 名 为 参数 ， 另 一 种 方式 是 
以 位 置 为 参数 。 因 此 ， 如 果 studId 和 grade 分 别 是 记录 集 res2 的 第 一 个 和 第 二 个 属性 的 话 ， 那 么 
程序 可 以 使 用 getLong(1) 和 8getString(2) 分 别 获 得 这 两 个 属性 的 值 。ResultSet 类 有 一 组 getXXX0 
方法 ，XXX 为 Java 的 基本 类 型 。 

JDBC 提 供 三 种 类 型 的 结果 集 ， 它 们 在 滚动 和 灵敏 度 方面 有 所 不 同 。 

“顾名思义 ，forward-only 类 型 结果 集 是 不 可 以 滚动 的 ， 游 标 只 能 向 前 移动 。 它 使 用 

DBMS 上 默认 的 游标 类 型 (INSENSITIVE 或 者 非 INSENSITIVE)。 

。scroll-insensitive 类 型 结果 集 。 它 是 可 以 滚动 的 ， 并 且 使 用 指定 DBMS 的 INSENSITIVE 类 

型 的 游标 ， 因 此 得 到 结果 集 后 (不管 是 生成 结果 集 的 事务 操作 的 还 是 其 他 事务 操作 的 )， 

对 数据 表 的 操作 都 不 会 在 结果 集中 看 到 。 

。scroll-sensitive 类 型 结果 和 集 。 它 是 可 以 滚动 的 ， 但 是 使 用 了 非 INSENSITIVE 类 型 的 游标 。 
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10.2.4 市 说 过 SQL 标准 没有 定义 当 INSENSITIVE 未 被 选择 时 的 行为 。 数 据 库 厂商 可 以 自 
由 地 实现 他 们 认为 合适 的 语义 。JDBC 通 常 提 供 所 访问 的 DBMS 所 支持 的 语义 。 许 多 厂 
商 实现 了 KEYSET_DRIVEN 语 义 ， 它 是 ODBC 规 范 的 一 部 分 ， 我 们 将 在 10.6 节 中 讨论 这 
个 规范 。 在 这 个 语义 中 ， 创 建 结果 集 之 后 ， 记 录 的 更 新 和 删除 是 可 见 的 ， 但 是 插入 是 不 
可 见 的 。JDBC 提 供 一 系列 的 方法 询问 驱动 程序 以 决定 期 望 看 到 的 内 容 。 
如 果 目 标 DBMS 不 支持 应 用 所 请 求 的 滚动 和 灵敏 度 ， 就 会 给 出 警告 。 
结果 集 可 以 是 只 读 的 也 可 以 是 可 更 新 的 。 对 于 可 更 新 的 结果 集 ，SQL 查 询 必须 满足 可 更 
新 视图 的 条 件 ( 见 6.3 节 )， 例 如 ， 下 面 的 createStatement() 的 变 体 创建 一 个 Statement 对 象 s3: 


Statement s3 = 
con1.createStatement (ResultSet .TYPE_SCROLL_SENSITIVE ， 
ResultSet .CONCUR_UPDATABLE) ; 


如 果 稍 后 调用 executeQuery() 方 法 ， 那 么 所 生成 的 结果 集 就 是 可 更 新 的 而 且 是 scroll-sensitive。 
其 他 选项 可 以 参阅 JDK 文 档 中 关于 ResultSet 和 Connection 类 的 说 明 。 

一 个 返回 字符 串 属 性 Name 的 SELECT 语句 生成 一 个 可 更 新 的 结果 集 res， 它 的 当前 行 可 以 
使 用 下 面 的 方法 将 Smith 冉 给 Name， 从 而 更 新 属性 Name 的 值 : 

res.updateString("Name", "Smith"); 
同 setXXX(0 和 getXXX() 方 法 一 样 ， 对 于 每 个 基本 类 型 都 有 相应 的 updateXXX() 方 法 。 

当 需 要 更 新 的 行 的 值 被 构建 以 后 ， 执 行 下 面 的 语句 更 新 原 表 : 

res.updateRow() ; 
不 仅 可 以 将 可 更 新 结果 集中 的 行 更 新 或 删除 ， 而 且 还 可 以 通过 结果 和 集 插 入 新 行 ， 这 是 与 静态 
SQL 和 动态 SQL 不 同 的 。 要 插入 的 行 的 列 值 首先 在 与 记录 集 关联 的 缓冲 器 中 装配 ， 然 后 调用 
res.insertRow() 方 法 将 缓冲 器 里 的 行 插入 到 结果 集 res 中 ， 同 时 也 插入 到 数据 库 中 。 


10.5.4 获取 结果 集 的 信息 


和 动态 SQL 相同 ， 编 写 程序 的 时 候 结 果 集 的 信息 是 无 从 得 知 的 ，JDBC 提 供 查 询 DBMS 的 
机 制 来 获取 这 类 信息 。 例 如 ，JDBC 提 供 ResultSetMetaData 类 ， 其 方法 可 以 用 于 获取 信息 。 


ResultSet rs3 = stmt3.executeQuery ("SELECT * FROM TABLE3"); 
ResultSetMetaData rsm3 = rs3.getMetaData(); 


上 面 的 语句 创建 ResultSetMetaData 对 象 rsm3， 并 用 关于 结果 集 rs3 的 信息 填充 它 ， 这 时 可 以 使 
用 下 面 的 方法 查询 该 对 象 : 


int numberOfColumns = rsm3.getColumnCount(); 
String columnName = rsm3.getColumnName(1); 
String typeName = rsm3.getColumnTypeName(1); 


第 一 个 方法 返回 结果 集 的 列 数 ， 后 两 个 方法 分 别 返 回 第 一 列 的 名 称 和 类 型 。 使 用 这 些 方法 ， 
甚至 不 需要 知道 结果 集 的 模式 ， 就 可 以 迭代 访问 每 行 的 每 个 字段 ， 检 查 它们 的 类 型 ， 并 获取 
数据 。 例 如 ， 如 果 rsm3.getColumnTypeName(2) 返 回 “Integer” 类 型 ， 那 么 程序 就 可 以 调用 
rs3.getInt(2) 获 得 当前 行 第 二 列 的 值 。 

JDBC 同 样 还 有 一 个 DatabaseMetaData 类 ， 可 以 通过 它 获 得 模式 信 ， 息 以 及 其 他 有 关 数 据 库 
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的 信息 。 
10.5.5 状态 处 理 
在 JDBC 中 ， 状 态 处 理 使 用 Java 的 标准 异常 处 理 机 制 ,其 基本 形式 如 下 : ， 


try { - 
... code that might cause an exception goes here .. . 


catch (SQLException e) { 
System.err.println("Bad things have happened: \n"); 
System.err.println("Message: " + e.getMessage()); 
System.err.println("SQLState: " + e.getSQLState()); 
System.err.println("ErrorCode: " + e.getErrorCode()); 
3; 
实际 上 ， 在 程序 中 ， 对 executeQuery() ，prepareStatement() 等 的 调用 都 应 该 使 用 try 这 样 的 语句 
封装 。 
系统 试图 执行 try 子 句 中 的 语句 ， 每 个 语句 包含 对 Java 或 者 JIDBC 对 象 方法 的 调用 。 方 法 在 
声明 的 时 候 可 以 指定 如 果 在 执行 方法 的 时 候 发 生 错 误 ， 那 么 就 抛 出 (thrown) 一 个 或 多 个 已 
命名 的 异常 ， 该 异常 的 名 称 表示 发 生 的 错误 的 类 型 。 例 如 ， 在 执行 查询 的 时 候 如 果 DBMS 返 
回 一 个 访问 错误 ， 那 么 JDBC 方 法 executeQuery0) 会 抛 出 SQLException 异 常 。 当 一 条 SQL 语 名 
的 执行 不 成 功 或 者 不 完全 的 时 候 会 发 生 访 问 错误 ， 更 具体 地 说 ， 返 回 的 SQLSTATE 的 值 是 除 
成 功 之 外 的 值 。 成 功 的 时 候 返 回 00XXX， 警 告 时 返回 01XXX， 没 有 数据 的 时 候 返 回 02000。 
如 果 在 try 子 句 中 抛 出 异常 ， 会 被 相应 的 catch 子 句 捕获 并 执行 。 在 例子 中 ， 一 个 
SQLException 对 象 e 被 创建 ， 它 的 方法 用 于 打印 出 错 信息 并 返回 SQLSTATE 的 值 或 者 厂商 特定 
的 错误 代码 ， 当 catch 子 句 执行 完毕 后 ， 程 序 继续 执行 后 面 的 语句 。 


10.5.6 执行 事务 


默认 情况 下 ， 当 创建 一 个 连接 的 时 候 数 据 库 处 于 自动 提交 模式 (autocommit mode)。 每 
条 SQL 语句 都 被 看 作 一 个 单独 的 事务 ， 当 语句 执行 完毕 就 被 提交 。 为 了 将 两 条 甚至 多 条 语句 
放 在 一 个 事务 里 ， 可 以 将 自动 提交 模式 关闭 : 

con4.setAutoCommit(false) ; 
其 中 ，con4 是 一 个 Connection 对 象 。 

开始 的 时 候 ， 每 个 事务 使 用 数据 库 管理 器 的 默认 隔离 级 别 ， 通 过 下 面 的 调用 可 以 改变 隔 
离 级 别 : 

con4. setTransactionIsolation (Connection. TRANSACTION_SERIALIZABLE) ; 
序列 化 级 别 TRANSACTION_SERIALIZABLE 和 TRANSACTION_REPEATABLE_READ 等 都 
是 定义 在 Connection 类 中 的 常量 (静态 整数 )。 

提交 或 者 终止 事务 使 用 Connection 类 的 commit() 方 法 和 rollback(0) 方 法 : 


con4.commit(); 
con4.rollback(); 


当 一 个 事务 被 提交 或 者 回 退 后 ， 下 一 个 SQL 语句 执行 时 就 会 生成 一 个 新 的 事务 (程序 的 
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第 一 条 SQL 语句 执行 也 会 生成 一 个 事务 )。 这 种 建立 事务 的 方法 被 称 作 链 (chaining), HE 
21.3.1 中 进一步 讨论 这 个 问题 。 

如 果 程 序 连接 到 多 个 DBMS ， 那 么 在 每 个 DBMS 中 的 事务 可 以 分 别 进行 提交 和 回 退 。 
JDBC 不 支持 确保 事务 集 从 全 局 上 说 是 原子 的 提交 协议 。 不 过 ， 可 以 使 用 一 种 新 提议 的 Java 包 
——JTS(Java Transaction Service)， 它 包括 TP 监 视 器 和 相应 的 API， 以 确保 使 用 JDBC 的 分 布 
式 事务 是 原子 提交 的 。TP 监 视 器 的 内 容 将 在 第 22 章 讨论 。 


10.5.7 服务 器 端的 存储 过 程 


如 果 DBMS 支 持 这 个 功能 ， 那 么 JDBC 可 以 调用 存储 过 程 。 例 如 ， 下 面 的 程序 调用 图 10-7 
定义 的 存储 过 程 : 

CallableStatement cs5 = 

cs5.setString(1, crs_code); 

cs5.setString(2, semester); 

cs5.setint(3, stud_id); 

cs5.getint(4, status); 


cs5.setString(5, message); 
cs5. executeUpdate () ; 


其 中 ，con5 是 一 个 Connection 对 象 。 

第 一 条 语句 声明 CallableStatement 对 象 cs5， 并 将 存储 过 程 Deregister0O) 赋 给 它 。 结 构 {call 
Deregister(?,?,?,2,?)} 外 面 的 大 括号 表明 该 结构 是 SQL escape 语 法 的 一 部 分 ， 使 得 驱动 程序 能 
使 用 特殊 的 方式 处 理 括 号 里 的 代码 。 Deregister0) 的 三 个 输入 参数 的 值 分 别 从 Java 变 量 crs_code、 
semester 和 stud_Id 中 获得 ， 通 过 setXXX0O 方 法 指定 (这 里 忽略 输出 参数 和 返回 值 的 细节 ， 它 们 
的 处 理 方式 稍 有 不 同 )。 最 后 一 条 语句 执行 调用 。 

除了 更 新 数据 库 外 ，DBMS 人 允许 存储 过 程 返回 一 个 结果 集 。 调 用 这 样 的 存储 过 程 被 看 作 
是 一 次 查询 ， 这 时 ， 上 面 的 最 后 一 条 语句 被 替换 为 : 

ResultSet rs5 = cs5.executeQuery(); 

JDBC 也 支持 以 字符 串 的 形式 创建 一 个 存储 过 程 并 将 它 发 送 给 DBMS 。 

10.5.8 示例 


图 10-12 是 一 个 调用 JDBC API 的 Java 程 序 ， 实 现 的 功能 和 图 10-3 相 似 。 有 一 点 不 同 ， 在 本 
例 的 SQL 语句 中 使 用 的 是 常量 ， 而 图 10-3 使 用 的 是 占 位 符 “?”。 


10.5.9 SQLJ: Java 的 语句 级 接口 


尽管 调用 级 接口 (如 JDBC) 可 以 在 静态 事务 处 理应 用 程序 中 使 用 (这 时 数据 库 模式 和 ，. 


SQL 语 句 的 模式 在 编译 的 时 候 已 经 知道 )， 但 是 运行 时 的 效率 要 比 语句 级 接口 (如 静态 SQL) 
低 ， 这 是 因为 预 处 理 和 执行 通常 要 与 DBBMS 单 独 通 信 。 正 因为 如 此 ， 各 公司 的 联盟 组 织 开发 
了 Java 的 语句 级 SQL 接口 ， 叫 做 SQLJ， 现 在 已 经 成 为 ANSI 标 准 。SQLJ 的 一 个 重要 目标 就 是 获 
得 与 Java 应 用 的 嵌入 式 SQL 相 同 的 运行 时 效率 ， 同 时 保留 通过 JDBC 访 问 DBMS 的 优点 。 

SQLJ 是 戏 入 式 SQL 的 专用 语言 ， 可 以 包含 在 Java 程 序 里 。 这 些 程序 通过 预 编译 器 转换 成 
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标准 的 Java， 同 时 候 入 式 SQLJ 结 构 被 替换 成 对 SQLJ 运 行 包 的 调用 ， 这 个 包 通 过 调用 JDBC 驱 
动 程序 访问 数据 库 。SQLJ 程 序 可 以 通过 不 同 的 JDBC 驱 动 程序 连接 到 不 同 的 DBMS。 和 嵌入 式 
SQL 一 样 ， 预 编译 器 会 检查 SQL 语法 和 参数 的 数目 和 类 型 ， 以 及 结果 的 数目 和 类 型 。 


import java.sql.*; 


// Use the right JDBC driver here 
Class.forName("sun. jdbc.odbc. JdbcOdbcDriver") ; 
} catch (ClassNotFoundException e) { 
return(-1); // Can't load driver 


} 
Connection con6 = null; 
try { 
String url = "jdbc:odbc:http://server.xyz.edu/sturegDB : 8000" ; 
con6 = DriverManager.getConnection(url,"john","ji21"); 
} catch (SQLException e) { 
return(-2); // Can't connect 
} 
con6.setAutoCommit (false); 
Statement stat6 = con6.createStatement(); 
try { 
stat6.executeUpdate ("DELETE FROM TRANSCRIPT " 
+ “WHERE StudId = 123456789 " 
+ "AND Semester = 'F2000' " 
+ "AND CrsCode = 'CS308'" ); 
} catch (SQLException e) { 
con6.rollback() ; 
stat6.close(); 
con6.close(); 
return(-3); // Can't execute 
} 
try { 
stat6.executeUpdate("UPDATE CLASS " 
+ "SET Enrollment = (Enrollment - 1) " 
+ "AND Semester = 'F2000' " 
+ "WHERE CrsCode = 'CS308'"); 
} catch (SQLException e) { 
con6.rollback(); 
stat6.close(); 
con6.close(); 
return(-4); // Can't update 
} 


con6.commit(); 
stat6.close(); 
con6.close(); 
return(0); // Success! 





图 10-12 在 Java 程 序 中 使 用 JDBC 


这 里 不 详细 介绍 SQLJ 的 语法 ， 只 是 概括 一 人 SQLJ、 人 嵌入 式 SQL 与 JDBC 之 间 的 区 别 。 
1) 对 于 代 和 人 式 SQL 来 说 ， 每 个 DBMS 厂 商 支 持 自己 的 SQL， 而 SQLJ 支 持 SQL-92， 从 而 更 
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有 具 可 移植 性 。 

2) 在 Java 程 序 中 ，SQL 语 名作 为 SQLJ 子 甸 的 一 部 分 ， 它 是 以 #SQL 开 头 ， 将 SQL 语 名 包含 
在 大 括号 里 ， 而 不 是 像 嵌 入 式 SQL 那样 以 EXEC SQL 开头 。 例 如 ， 图 10-1 中 的 SELECT 语句 写 
成 SQLJ 时 变 成 下 面 的 形式 : 

#SQL {SELECT C.Enrollment 

INTO :numEnrolled 
FROM CLASS C 


WHERE C.CrsCode = :crsCode 
AND C.Semester = :semester}; 


3) 在 静态 SQL 中 ， 任 何 Java 变 量 都 可 以 作为 SQL 语句 的 参数 ， 只 要 以 “: ”作为 前 级 即 可 。 
因为 可 以 在 编译 时 完成 ， 所 以 这 种 参数 传递 方式 在 运行 时 比 JDBC 里 的 方法 要 有 效 的 多 。 在 
JDBC 里 ， 每 个 参数 的 值 在 运行 时 必须 与 一 个 占 位 符 “?” 绑 定 。 

4) 在 SQLJ 中 ， 查 询 返 回 一 个 SQLJ 和 迭代 器 (iterator) 对 象 而 不 是 ResultSet 对 象 。SQLJ i& 
代 器 与 结果 集 相 似 ， 在 结果 集中 提供 游标 机 制 ? 。 事 实 上 ，SQLJ 和 友 代 器 对 象 和 ResultSet 对 象 
实现 了 相同 的 Java 接 口 java.util.Iterator。 和 迭代 器 对 象 存储 整个 结果 集 ， 并 且 提 供 next(0 这 样 的 
方法 扫描 结果 集中 每 行 记 录 。 例 如 ， 图 10-13 是 图 10-6 的 SQLJ 版 本 。 


import java.sql.* 


#SQL iterator GetEnrolledIter(int studentId, String studGrade) ; 
GetEnrolledIiIter iter1; 


#SQL iteri = { SELECT T.StudId AS "studentId", 
T.Grade AS "“studGrade" 
FROM TRANSCRIPT T 
WHERE T.CrsCode = :crsCode 
AND T.Semester = :semester }; 


int id; 

String grade; 

while (iter1.next()) { 
id = iter1.studentId(); 
grade = iter1.studGrade(); 
... process the values in id and grade ... 

} - | 


iter1.close(); . 





图 10-13 在 SQLJ 中 使 用 迭代 器 


程序 的 第 一 条 语句 告诉 SQLJ 预 编译 器 生成 Java 语 句 ， 该 语句 定义 一 个 GetEnrolledIter 类 ， 
这 个 类 实现 sqlj.runtime.NamedIterator 接 口 ， 它 是 标准 Java 接 口 java.util.Iterator 的 扩展 ， 并 提 
供 next() 方 法 。GetEnrolledIter 类 可 以 用 来 存储 每 行 有 两 列 的 结果 集 ， 一 列 是 整 型 ， 另 一 列 是 
字符 串 型 。 声 明 将 这 两 个 字段 命名 为 studentID 和 studGrade ， 同 时 隐 式 地 定义 了 列 访问 器 
(column accessor) 方法 studentId() 和 studGrade()， 它 们 用 来 返回 存储 在 相应 列 中 的 值 。 


O SQLI 和 迭代 器 可 以 转换 成 结果 集 ， 反 之 亦 然 。 





234 第 二 序 分 KEEA 





第 二 条 语句 声明 一 个 GetEnrolledIter 类 对 象 iterl。 

第 三 条 语句 执行 SELECT 并 将 结果 集 存储 在 iterl1 中 。 注 意 ，AS 子 句 将 SQL 的 属性 名 与 过 
代 器 中 的 列 名 联系 在 一 起 ， 这 些 名 字 不 一 定 要 相同 ， 但 是 类 型 和 数量 上 要 一 致 。 

最 后 ，while 语 句 将 行 的 值 存储 在 宿主 变量 id 和 grade 中 ， 以 便 处 理 。 

5) SQLJ 有 自己 的 机 制 来 定义 连接 对 象 和 连接 数据 库 ， 程 序 可 以 同时 有 几 个 活动 的 连接 。 
与 嵌入 式 SQL 不 同 的 是 ， 每 个 SQLJ 语 句 可 以 选择 一 个 数据 库 连 接 ， 并 将 这 个 语句 应 用 在 那个 
连接 上 。 例 如 ， 本 节 开 头 的 第 一 个 SELECT 语句 可 以 写成 : 


#SQL [db1] {SELECT C.Enrollment. 
INTO :num_enrolled 
FROM Crass C 
WHERE C.CrsCode = :crs_code 
AND C.Semester = :semester}; 


它 指定 将 语句 应 用 到 先前 定义 的 名 为 db1 的 数据 库 连 接 上 。 如 果 没 有 指定 这 个 选项 ， 那 么 
将 所 有 的 SQL 语 句 应 用 到 默认 的 数据 库 连接 上 ， 这 与 伐 入 式 SQL 相 同 。 回 忆 一 下 ， 在 JDBC 中 ， 
每 个 SQL 语 句 总 是 通过 Statement 对 象 显 式 地 和 一 个 指定 的 数据 库 连 接 关 联 在 一 起 。 

6) 正如 静态 与 动态 嵌入 式 SQL 语句 可 以 包含 在 相同 的 宿主 语言 程序 中 一 样 ，SQLJ 语 句 和 
JDBC 调 用 也 可 以 同时 包含 在 同一 个 Java 程 序 中 。 


10.6 ODBC* 


FARKE HÆ (Open DataBase Connectivity, ODBC) 是 DBMS 的 API， 提 供 执行 
SQL 语句 的 调用 级 接口 。 下 面 的 内 容 基于 Microsof 开 发 的 OPBC 规 范 ， 但 要 注意 ， 有 些 厂 商 
并 不 支持 所 有 的 功能 。 

SQL 标 准 组 织 长 期 以 来 一 直 致 力 于 规范 调用 级 接口 (如 SQL/CLI)， 以 取代 笨重 的 动态 
SQL, ODBC 正 是 这 种 规范 的 早期 版 本 的 一 个 分 支 , 它 与 最 新 发 布 的 SQL/CLI 有 许多 共同 之 处 。 
SQL/CLI 包 括 在 SQL:1999 中 ，Microsoft 宣 称 ODBC 会 与 这 个 新 颁布 的 标准 保持 一 致 。 

ODBC 应 用 程序 的 软件 体系 结构 和 JDBC 很 相似 ，JDBC 使 用 驱动 程序 管理 器 并 且 每 个 被 访 
问 的 DBMS 都 会 有 一 个 独立 的 驱动 程序 。 但 是 ODBC 不 是 面向 对 象 的 ， 所 以 它 提供 对 DBMS 的 
较 底 层 接口 。 例 如 ， 在 ODBC 里 , 应 用 必须 专门 分 配 和 释放 由 驱动 程序 管理 器 和 驱动 程序 使 
用 的 存储 空间 。 而 在 JDBC 里 ， 当 创建 适当 的 对 象 的 时 候 ， 存 储 空间 会 自动 分 配 。 因 此 ， 
ODBC 应 用 在 调用 函数 SQLConnect() 请 求 连接 到 数据 库 管理 器 前 ， 必 须 先 调用 函数 
SQLAllocConnect() 来 请 求 驱动 程序 管理 器 分 配 连 接 所 需 的 存储 空间 。 而 当 应 用 调用 
SQLDisconnect() 从 数据 库 管理 器 断 开 之 后 ， 程 序 必 须 调 用 SQLFreeConnect() 来 释放 存储 空间 。 
这 样 的 操作 使 ODBC 程 序 更 容易 发 生 内 存 泄 江 (memory leak), 它 是 因 程序 没有 释放 不 再 使 用 
的 ODBC 结 构 而 积累 起 来 的 垃圾 内 存 。 

图 10-14 显 示 了 C 程 序 中 一 些 常 用 函数 的 调用 方法 9 ， 每 个 函数 返回 一 个 值 标识 成 功 与 否 。 


日 ”这 里 以 及 以 后 的 例子 中 我 们 都 简化 了 语法 ， 目 的 是 强调 ODBC 交 互 的 语义 。 例 如 在 现实 中 ， 字 符 串 参数 
(database_name) 要 中 一 个 长 度 的 字段 。 
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SQLAllocEnv (&henv) ; 
SQLAllocConnect (henv, &hdbc); 
SQLConnect (hdbc ,database_name,userld, password) ; 
SQLAllocStmt(hdbc, &hstmt); 
SQLExecDirect(hstmt, ...SQLstatement...); 
.. process results .. 
SQLFreeStmt(hstmt, fOption) ; 
SQLDisconnect (hdbc) ; 
SQLFreeConnect (hdbc) ; 


”SQLFreeEnv(henv) ; 





图 10-14 C 程 序 中 的 ODBC 过 程 调用 框架 


。SQLAIllocEnv0O 在 驱动 程序 管理 器 中 为 应 用 的 ODBC 接 口 分 配 和 初始 化 存储 空间 。 它 返 
回 一 个 标识 句柄 henv。 句 柄 (handle) 是 一 种 应 用 程序 用 来 引用 该 数据 结构 的 机 制 。 在 
CC 中， 句柄 即 为 指针 ， 但 是 在 其 他 宿主 语言 中 ， 它 的 实现 有 些 不 太一 样 。ODBC 驱 动 程 
序 管 理 器 内 部 使 用 环境 域 存 放 运 行 时 信息 。 

“SQLAllocConnectO 在 驱动 程序 管理 器 中 为 连接 分 配 内 存 ， 并 返回 连接 句柄 hdbc。 

。SQLConnect(0 装 载 合适 的 数据 库 驱动 程序 , 然后 使 用 刚才 分 配 的 连接 hdbc、 数 据 库 名 称 、 
用 户 Id 和 密码 连接 到 DBMS 服 务 器 。 

如 果 应 用 想 连接 到 多 个 数据 库 管理 器 ， 就 要 为 每 个 管理 器 分 别 调用 SQLAllocConnect0 和 
SQLConnect(), BABE (可 能 有 多 个 ) 为 每 个 连接 维护 独立 的 事务 。 

*。SQLAliocStmtO 在 驱动 程序 中 为 SQL 语句 分 配 存储 空间 ， 并 返回 这 个 语句 的 句柄 hstms。 

“SQLExecDirect(O 接 受 使 用 SQLAllocStmt0 分 配 的 语句 句柄 和 一 个 含有 SQL 语句 的 字符 串 
变量 ， 请 求 DBMS 预 处 理 和 执行 语句 。 同 一 个 句柄 可 以 使 用 多 次 以 执行 不 同 的 SQL 语句 。 
SQL 语句 可 以 是 数据 操纵 语句 (例如 SELECT 和 UPDATE )， 也 可 以 是 DDL 语 名 (例如 
CREATE 和 GRANT)。 但 是 ， 它 不 能 包含 一 个 代 人 式 的 对 宿主 变量 的 引用 ， 因 为 变量 
名 只 能 在 编译 的 时 候 转 换 成 内 存 地 址 。 注 意 ，SQLExecDirect() 与 动态 SQL 中 的 
EXECUTE IMMEDIATE 相 关联 但 是 比 它 更 通用 ， 因 为 后 者 不 能 返回 数据 给 应 用 ( 见 
10.4.1 节 )， 而 前 者 可 以 使 用 SELECT 生成 一 个 结果 集 ， 并 可 以 通过 游标 访问 结果 集 
( 见 10.6.2 节 ) 。 

“SQLDisconnectO 从 服务 器 断 开 ， 这 个 函数 使 用 连接 句柄 作为 参数 。 

e SQLFreeStmt()、SQLFreeConnect() 和 SQLFreeEnv0 〇 释放 句柄 并 释放 由 相应 的 Alloc 函 数 
分 配 的 存储 空间 。 


10.6.1 预 处 理 语句 
应 用 程序 调用 下 面 的 函数 ， 而 不 是 调用 SQLExecDirect0 对 语句 预 处 理 : 


SQLPrepare(hstmt, -SQL statement...); 
然后 调用 


SQLExecute (hstmt) ; 


执行 这 条 语句 。 
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和 动态 SQL 一 样 ，SQLPrepare() 的 语句 参数 可 以 包含 占 位 符 “?”。 程 序 使 用 - 
SQLBindParameters(0) 函 数 提供 变量 给 这 些 参数 ， 例 如 ， 下 面 的 调用 9。: 


SQLBindParameters(hstmt, 1, SQL_PARAMETER_INPUT, 
SQL_C_SSHORT, SQL_SMALLINT, &int1); 


将 语句 hstmt 的 第 一 个 参数 和 宿主 语言 变量 int1 绑 定 ，hstmt 是 一 个 输入 参数 ， 而 int1 是 C 语 言 
的 short 类 型 。 执 行 SQLBindParameters () 会 将 语句 中 的 第 一 个 占 位 符 “?” 替换 为 这 个 参数 的 
值 ， 并 将 C 中 的 short 类 型 转换 为 SQL 中 的 SMALLINT 类 型 。 因 为 这 个 过 程 调用 是 宿主 语言 编 
译 器 编译 的 ， 所 以 对 参数 列表 中 宿主 语言 变量 int1 的 引用 可 以 在 编译 的 时 候 处 理 。 这 与 
SQLExecDirectO 不 同 ， 它 不 允许 引用 宿主 变量 。 


10.6.2 游标 


使 用 函数 SQLExecDirect0 或 者 SQLExecute() 执 行 SQL 语句 不 会 给 应 用 返回 任何 数据 ， 而 
是 通过 游标 返回 数据 ， 它 由 ODBC 驱 动 程序 维护 并 被 SQLAlocStmt() 国 数 返 回 的 语句 句柄 
hstmt 引 用 。 为 了 获取 数据 还 必须 调用 相应 的 ODBC 函 数 。 

程序 可 以 调用 SQLBindColO 将 结果 集 里 的 某 一 个 列 与 程序 里 的 某 个 宿主 变量 绑 定 起 来 。 
例如 ， 下 面 的 调用 8 将 第 一 个 列 与 整 型 变量 int2 绑 定 在 一 起 : 

SQLBindCol(hstmt, 1, SQL.C_SSHORT, &int2); 

调用 SQLEFetch(hstmb 时 ， 游 标 向 前 移动 ， 当 前 行 里 列 的 值 存储 在 与 其 绑 定 的 变量 里 。 如 
果 某 个 列 没 有 被 绑 定 到 指定 的 宿主 变量 ， 程 序 可 以 调用 SQLGetData(O 检 索 和 存储 该 列 的 值 。 
例如 ， 下 面 的 调用 将 当前 行 里 第 二 列 的 值 存 储 在 整 型 变量 int3 中 : 

SQLGetData(hstmt, 2, SQL_C_SSHORT, &int3); 

在 执行 SELECT 语句 之 前 ， 应 用 程序 可 以 使 用 SQLSetStmtOption0 指 定 游标 的 类 型 ， 共 有 
三 种 类 型 可 以 选择 : 

1) STATIC。 与 对 入 式 SQL 中 的 游标 类 型 INSENSITIVE 一 样 ， 当 执行 SELECT 语句 的 时 候 ， 
驱动 程序 建立 结果 集 的 行 的 一 个 拷贝 。 游 标 访问 的 是 这 个 拷贝 ， 如 图 10-5 所 示 。 这 种 返回 的 
数据 类 型 称 作 快照 (snapshot). 

2) KEYSET_DRIVEN 。 当 执行 SELECT 语 句 的 时 候 ， 了 驱动 程序 建立 一 组 指针 指向 基 表 中 
满足 WHERE 子 句 的 行 。 如 果 当 前 事务 或 者 同步 事务 中 的 其 他 语句 更 新 或 者 删除 其 中 的 其 一 行 ， 
这 个 变化 会 在 下 一 次 调用 SQLFetch() 时 体现 出 来 。 但 是 、 如 果 是 插入 一 行 ， 虽然 它 也 满足 
WHERE 子 句 ， 该 变化 却 不 能 在 下 一 次 调用 SQLFetchO 时 体现 出 来 ， 这 是 因为 指针 指向 的 行 没 
有 位 于 集合 中 。 另 外 ， 可 以 改变 行 里 某 个 属性 的 值 从 而 不 再 满足 WHERE 子 句 ， 但 是 仍 能 够 通 
过 游标 访问 。 这 种 返回 数据 的 类 型 称 作 动态 集 (dynaset)， 见 图 10-15。 


O 这 里 简化 了 语法 ， 实 际 上 SQLBindParameters(O) 的 参数 不 少 于 10 个 。 

O 与 此 相同 ， 在 许多 ODBC 结 构 中 ， 程 序 员 需要 指明 DBMS 中 的 SQL 数 据 类 型 与 应 用 程序 中 的 C 语 言 数 据 类 型 
之 间 的 转化 。 | l 

© 这 里 简化 了 语法 。 

@ 这 里 简化 了 语法 。 
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Transcript 表 
图 10-15 使 用 KEYSET_DRIVEN 游 标 检索 TRANSCRIPT 中 的 记录 


3) DYNAMIC。 结 果 集 中 的 数据 是 完全 动态 的 。 执 行 完 SELECT 语句 后 ， 当 前 事务 或 者 并 
发 事务 中 的 语句 不 仅 可 以 修改 和 删除 结果 集中 的 行 ， 而 且 还 可 以 插入 一 行 记 录 ， 这 些 变化 都 
可 以 在 下 一 次 调用 SQLFetchO 时 体现 出 来 。 

ODBC 规 范 建 议 实 现 所 有 类 型 的 游标 。 但 是 ，ODBC 可 以 得 到 的 某 个 DBMS 的 机 制 可 能 会 
使 实现 某 种 类 型 的 游标 很 困难 ， 因 此 这 个 DBMS 的 驱动 程序 只 能 支持 其 中 的 一 部 分 游标 类 型 。 
很 明显 ，DYNAMIC 游 标 实现 起 来 最 困难 ， 许 多 驱动 程序 并 没有 实现 这 种 类 型 的 游标 。 

语句 SQLSetStmtOption 可 以 用 来 请 求 游标 的 类 型 ， 形 式 如 下 : 

SQLSetStmtOption(hstmt ,SQL_CURSOR_TYPE, Option) ; 
xh, Optionf:SQL_CURSOR_STATIC, SQL_CURSOR_DYNAMIC 或 者 SQL CURSOR_ 
KEYSET_DRIVEN 中 的 一 个 常量 。 

ODBC 也 支持 通过 非 静 态 的 游标 更 新 指定 的 位 置 ， 这 时 ，SELECT 语 句 必 须 用 FOR 
UPDATE 加 以 定义 。 例 如 : 


SQLExecDirect(hstmti, "SELECT * \ 
FROM EMPLOYEE \ 
FOR UPDATE OF Salary"); 


它 使 用 已 经 分 配 的 语句 句柄 hstmt1 预 处 理 一 个 查询 ， 该 查询 的 游标 允许 通过 寸 Salary 属 性 更 新 
EMPLOYEE 关 系 。 

假设 执行 若干 次 SQLFetch(hstmt1) 后 游标 位 于 employee 属 性 值 是 “Joe Public” 的 这 一 行 ， 
现在 要 将 Joe 的 薪水 增加 100 美 元 ， 可 以 使 用 下 面 的 语句 : 


SQLExecDirect(hstmt2, "UPDATE EMPLOYEE \ 
SET Salary = Salary + 1000\ 
WHERE CURRENT OF employee_cursor") ; 


其 中 hstmt2 是 以 前 分 配 的 一 个 语句 句柄 。 上 面 语句 的 一 个 问题 是 ， WHERE CURRENT OF 
子 句 中 的 游标 名 称 employee_cursor 可 能 是 无 效 的 ， 因 为 它 并 没有 同 与 hstmt1 句 柄 相关 的 游 
标 建立 联系 ， 因 此 执行 上 面 的 更 新 操作 前 必须 给 游标 起 一 个 名 字 。ODBC 使 用 下 面 的 方法 指 
定名 字 : 

SQLSetCursorName(hstmt1, employee_cursor) ; 

和 动态 SQL 一 样 ， 在 编写 程序 的 时 候 并 不 知道 查询 的 结果 集 的 信息 ， 因 此 ODBC 提 供 一 组 
图 数 来 获得 这 些 信 息 。 例 如 ， 预 处 理 一 条 语句 后 ， 程 序 可 以 调用 函数 SQLNumResultCols() 获 
得 结果 集中 列 的 个 数 ， 而 函数 SQLColAttributes0 和 SQLDescribeCol0 可 以 提供 结果 集中 指定 
列 的 相关 信息 。 
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ODBC 还 提供 一 组 函数 返回 数据 库 模 式 的 信息 , 这 组 函数 称 为 目录 函数 (catalog function). 
例如 ， 函 数 SQLTablesO 返 回 结果 集中 所 有 表 的 名 称 ， 而 SQLColumns( 返 回 字段 的 名 称 。 


10.6.3 状态 处 理 


到 目前 为 止 ， 所 讨论 的 OPDBC 过 程 实际 上 都 返回 一 个 类 型 为 RETCODE 的 值 ， 表 示 指 定 的 
动作 是 否 成 功 。 例 如 ， 下 面 的 示例 使 用 这 个 值 判 断 成 功 与 否 : 

RETCODE retcodei; 

retcodel = §QLConnect(--:); 

if (retcodel != SQL_SUCCESS) { 


-++ do something --- 
} 


关于 错误 的 额外 信息 可 以 通过 调用 SQLErrorO 获 得 。 
10.6.4 执行 事务 


默认 情况 下 ， 数 据 库 在 创建 一 个 连接 时 处 于 自动 提交 模式 。 为 了 在 一 个 事务 中 执行 多 条 
语句 ， 可 以 通过 下 面 的 函数 关闭 自动 提交 模式 : 
SQLSetConnectionOption(hdbc, 


SQL_AUTOCOMMIT, 
SQL_AUTOCOMMIT_OFF) ; 


其 中 ，hdbc 是 一 个 连接 句柄 。 初 始 状态 下 ， 每 个 事务 使 用 数据 库 管理 器 默认 的 隔离 级 别 ， 可 
以 调用 下 面 的 方法 改变 级 别 : 


SQLSetConnectionOption(hdbc, 
SQL_TXN_ISOLATION, 
SQL_TXN_REPEATABLE_READ) ; 


使 用 下 面 的 方法 可 以 提交 或 者 回 退 事务 : 

SQLTransact(henv, hdbc, Action); 
这 里 ，Action 是 SQL_COMMIT 或 者 SQL_ABORT。 

当 事 务 提交 或 者 回 退 以 后 ， 执 行 下 一 条 SQL 语句 会 开始 一 个 新 的 事务 (或 者 程序 的 第 一 
条 SQL 语句 执行 的 时 候 也 会 开始 一 个 新 事务 ) 。 

如 果 程 序 连接 到 多 个 数据 库 , 每 个 数据 库 上 的 事务 是 独立 提交 和 回 退 的 。ODBC 不 支持 确 
保 事 务 集 是 全 局 原子 的 提交 协议 。 不 过 ，Microsoft 引 进 了 新 的 TP 监 控 器 一 MTS (Microsoft 
Transaction Server) ， 它 包括 一 个 事务 管理 器 和 一 组 API 来 保证 使 用 ODBC 的 分 布 式 事务 是 原 
子 提交 的 。 


10.6.5 服务 器 端的 存储 过 程 


如 果 DBMS 支 持 这 个 特性 ， 那 么 可 以 使 用 ODBC 调 用 存储 过 程 。 例 如 ， 为 了 调用 图 10-7 的 
存储 过 程 ， 可 以 先 用 以 下 方法 预 处 理 调用 语句 : 


SQLPrepare(hstmt, "{call Deregister(?,?,?,?,?)}"); 
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Deregister () 外 面 的 大 括号 表示 转 义 语法 ， 参 见 10.5.7 节 。Deregister() 的 参数 可 以 通过 
SQLBindParameter() 函 数 与 宿主 语言 变量 绑 定 。 执 行 调用 过 程 如 下 : 


SQLExecute(hstmt) ; 
FIHRAKSQL—FF, BRDBMS Hit FF hit BE — TERR, ABZ ee AP LE ps 
从 结果 集 检 索 数据 。 ` 
10.6.6 示例 | 


图 10-16 是 一 个 包含 ODBC 过 程 调用 的 C 语 言 程 序 ， 它 执行 的 事务 与 图 10-12 相 同 。 作 为 过 
程 SQLConnect0 和 SQLExecDirect(0) 中 的 参数 的 常量 SQL_NTS 表 示 一 个 以 null 结 尾 的 空 字符 串 。 


HENV henv; 
HDBC hdbc; 
HSTMT hstmt; 
RETCODE retcode; 
SQLAllocEnv (khenv) ; 
SQLAllocConnect(henv, &hdbc); 
retcode = SQLConnect(hdbc, dbName, SQL_NTS, "john", SQL_NTS, "j121", 
SQL_NTS); 
if (retcode != SQL_SUCCESS) { 
SQLFreeEnv (henv); 
return(-1) ; 
} 
SQLSetConnectionOption(hdbc, SQL_AUTOCOMMIT, SQL_AUTOCOMMIT_OFF) ; 
SQLAllocStmt (hdbc, &hstmt); 
retcode = SQLExecDirect(hstmt, 
"DELETE FROM TRANSCRIPT \ 
WHERE StudId = 123456789 \ 
AND Semester = 'F2000' \ 
AND CrsCode = 'CS308'", 
SQL_NTS); 
if (retcode != SQL_SUCCESS) { 
SQLTransact (henv, hdbc, SQL_ABORT); 
SQLFreeStmt(hstmt, SQL_DROP); 
SQLDisconnect (hdbc) ; 
SQLFreeConnect (hdbc) ; 
SQLFreeEnv (henv); 
return (-2) ; 
} 
retcode = SQLExecDirect (hstmt, 
"UPDATE CLass \ 
SET Enrollment = (Enrollment - 1) \ 
WHERE CrsCode = 'CS308'", 
SQL_NTS) ; 
if (retcode != SQL_SUCCESS) { 
SQLTransact(henv, hdbc, SQL_ABORT); 
SQLFreeStmt (hstmt, SQL_DROP); 
SQLDisconnect (hdbc) ; 
SQLFreeConnect (hdbc) ; 
SQLFreeEnv(henv) ; 
return(-3) ; 
} 
SQLTransact(henv, hdbc, SQL_COMMIT) ; 
SQLFreeStmt (hstmt , SQL_DROP) ; 
SQLDisconnect (hdbc) ; 
SQLFreeConnect (hdbc) ; 
SQLFreeEnv (henv) ; 





图 10-16 用 C 编 写 的 ODBC 程 序 
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10.7 比较 


到 目前 为 止 ， 我 们 已 经 讨论 了 访问 数据 库 的 不 同方 法 ， 每 种 方法 都 有 自己 的 优点 和 缺点 ， 
下 面 对 此 加 以 总 结 。 

* 在 某 些 情况 下 〈 如 静态 SQL 和 SQLI 中 ) ，SQL 语 句 使 用 特殊 的 语法 。 而 在 动态 SQL、 

JDBC 和 ODBC 中 ，SQL 语 句 是 作为 变量 的 值 。 前 者 的 优点 是 简单 ， 但 是 与 数据 库 的 交互 

只 能 限定 在 编译 的 时 候 。 在 某 些 应 用 中 ， 执 行 的 语句 要 到 运行 时 才能 确定 ， 这 时 候 动态 

生成 SQL 语句 是 十 分 重要 的 。 

. 有 时 候 ， 应 用 程序 必须 使 用 所 连接 的 DBMS 的 专用 SQL， 这 使 得 将 程序 移植 到 另 一 个 

DBMS 变 得 十 分 困难 。 而 在 SQLJ、JDBC 和 ODBC 中 ， 应 用 程序 使 用 统一 的 专用 语言 ， 

并 提供 模块 将 它 转换 到 特定 厂商 的 专用 语言 ， 因 此 提高 了 可 移植 性 ， 但 是 这 样 的 程序 就 

不 能 使 用 某 个 厂商 提供 的 特殊 功能 。 . 

“评估 各 种 技术 在 运行 时 的 开销 涉及 许多 因素 ， 如 通信 、 预 处 理 以 及 参数 传递 等 等 。 虽 然 

有 时 候 开销 与 技术 的 实现 方式 有 关 ， 但 是 仍然 可 以 大 致 总 结 如 下 。 

对 于 语句 级 接口 ，SQL 语 句 包含 嵌入 式 参数 的 名 称 ， 在 编译 的 时 候 可 以 处 理 该 名 称 并 生 
成 参数 传递 代码 。 运 行 时 ， 语 名 被 传递 到 服务 器 进行 预 处 理 和 执行 ， 因 此 一 次 通信 就 足够 了 。 
对 于 调用 级 接口 和 动态 SQL， 参 数 名 称 不 包含 在 语句 中 ， 因 为 在 编译 的 时 候 (通过 符号 表 可 
以 将 参数 名 称 映射 成 地 址 ) 语句 是 得 不 到 的 。 相 反 ， 如 果 它 们 是 分 别提 供 的 ， 那 么 就 可 以 在 
编译 的 时 候 进行 处 理 。 因 此 需要 一 次 通信 来 发 送 预 处 理 的 语句 ， 而 另外 一 次 通信 请 求 执行， 
不 过 EXECUTE IMMEDIATE 例 外 。 这 是 非常 重要 的 ， 因 为 通信 的 开销 昂贵 而 且 耗 费时 间 。 

如 果 SQL 语 句 是 动态 生成 的 (动态 SQL、JDBC 和 ODBC)， 那 么 预 处 理 必须 在 运行 的 时 候 
进行 。 但 即使 是 静态 SQL， 预 处 理 通常 也 是 在 语句 被 提交 执行 的 时 候 进行 的 。 在 所 有 的 情况 
下 ， 如 果 语 名 执行 多 次 ， 预 处 理 的 开销 可 以 分 摊 到 每 次 执行 中 去 ， 因 而 不 再 是 一 个 主要 因素 。 
最 有 效 的 避免 运行 时 预 处 理 操作 的 方法 是 使 用 存储 过 程 ， 它 可 以 让 DBMS 在 程序 执行 前 创建 
和 存储 一 个 查询 执行 计划 。 通 常 ， 存 储 过 程 为 过 程 中 的 每 个 SQL 语句 单独 生成 一 个 计划 ， 更 
为 成 熟 的 系统 是 将 它 看 成 一 个 整体 生成 一 个 优化 计划 ， 因 为 已 知 SQL 语句 的 顺序 。 为 一 个 语 
句 生成 的 数据 结构 可 以 保留 下 来 供 下 一 条 语句 使 用 。 


10.8 参考 书目 


柑 入 式 和 动态 SQL 可 以 追溯 到 很 早 以 前 ， 任 何 SQL 手 册 都 或 多 或 少 地 包含 一 些 相 关内 容 。 下 面 的 参 
考 书 值得 一 看 : [Date and Darwen 1997, Melton and Simon 1992, Gulutzan and Pelzer 1999]. 

介绍 ODBC 的 文献 很 多 ，Microsoft 出 版 了 一 本 权威 指南 [Microsoft 1997]。 此 外 ， 还 可 以 参考 
[Signore et al. 1995], [Venkatrao and Pizzo 1995] 讨论 了 SQL/CLI 的 历史 和 原理 ， 这 是 一 个 与 ODBC 相 似 
的 新 的 SQL 标 准 。SQL 存 储 过 程 可 以 参阅 [Eisenberg 1996, Melton 1997] 中 的 介绍 。 有 关 JDBC 和 SQLJ 的 
信息 可 以 很 容易 地 从 相关 网 页 [Sun 2000] 和 [SQLJ2000] 获 得 ， 但 是 [Reese 2000, Melton et al. 2000] 是 学 习 
这 些 技术 的 更 好 选择 。 
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10.9 练习 


10.1 


10.4 
10.5 


10.6 


10.7 


10.8 
10.9 


10.10 


10.11 


解释 你 机 器 上 的 应 用 程序 器 使 用 什么 方法 来 完成 下 面 的 工作 : 
a. 在 宿主 语言 中 包含 SQL 语句 。 

b. 创建 数据 库 表 。 

c. 连接 和 断 开 数 据 库 。 

d. 创建 、 提 交 和 中 止 事 务 。 

e. 指定 隔离 级 别 。 

f. 改变 约束 检查 的 模式 。 

g. 授予 用 户 在 某 个 表 上 执行 SELECT 语句 的 权限 。 


a. 为 什么 嵌 和 人 式 SQL 和 SQLJ 需 要 预 编 译 器 ， 而 ODBC 和 JDBC 不 需要 预 编 译 器 ? 


b. 嵌入 式 SQL 的 预 编 译 器 将 SQL 语句 转换 成 过 程 调用 ， 而 调用 级 接口 (如 ODBC 和 JDBC) 是 将 
SQL 语句 作为 过 程 调用 的 参数 ， 两 者 的 区 别 是 什么 ? 

a. 为 什么 约束 检查 通常 在 事务 处 理应 用 中 被 推迟 进行 ? 

b. 举例 说 明 在 事务 处 理应 用 中 不 希望 进行 即时 约束 检查 的 情况 。 

说 明 在 事务 处 理应 用 中 使 用 存储 过 程 的 优点 和 缺点 。 

写 出 使 用 下 面 的 方法 实现 的 程序 : 

a. 嵌入 式 SQL 

b.JDBC 

c.ODBC 

d. SQLJ 

这 个 程序 实现 学 生 注册 系统 中 的 注册 事务 ， 请 参考 图 $-15 和 5-16 中 的 数据 库 模 式 。 

写 出 使 用 下 面 的 方法 实现 的 程序 : 

a. IKA IRSOL 

b. JDBC 

c. ODBC 

d. SQLJ 

这 个 程序 使 用 游标 打印 出 学 生 注 册 系 统 中 某 个 学 生成 绩 单 ， 请 参考 图 5-15 和 5-16 中 的 数据 库 模 式 .。 

a. 为 什么 嵌 人 式 SQL 和 SQLJ 使 用 宿主 语言 变量 作为 参数 ， 而 动态 SQL、JDBC 和 ODBC 使 用 占 位 符 
“7 9 

b. 为 什么 在 嵌入 式 SQL 中 使 用 宿主 语言 变量 作为 参数 比 使 用 占 位 符 “?” 要 好 ? 

解释 动态 SQL 与 JDBC 和 ODBC 相 比 的 优点 和 缺点 。 

写 出 使 用 下 面 的 方法 实现 RS 

a. FRAKSQOL 

b. JDBC 

c. ODBC 

d. SQLJ 

这 个 程序 在 不 同 的 DBMS 中 传递 表 中 的 记录 。 你 的 事务 具有 全 局 原子 性 吗 ? 

编写 一 个 在 本 地 浏览 器 中 运行 的 Java 程 序 ， 使 用 DBC 连 接 到 本 地 机 上 的 DBMS ， 并 对 创建 好 的 
表 执行 一 个 简单 查询 。 

假设 在 编译 的 时 候 ， 程 序 员 已 知 要 执行 的 SQL 语句 、DBMS 和 数据 库 模式 的 所 有 细节 ， 比 较 使 用 
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嵌入 式 SQL 与 使 用 DBC 和 ODBC 相 比 的 优点 和 缺点 。 
10.12 10.6 节 讨论 了 KEYSET_DRIVEN 类 型 的 游标 。 
a. STATIC 和 KEYSET_DRIVEN 游 标 之 间 有 何不 同 ? 
b. 举例 说 明 使 用 这 些 游标 可 以 返回 不 同 的 结果 ， 即 使 事务 是 独立 执行 的 。 
c. 为 什么 更 新 和 删除 操作 可 以 通过 KEYSET_DRIVEN 类 型 的 游标 来 完成 ? 
写 出 一 个 包含 游标 的 事务 程序 ， 程 序 中 FETCH 语 句 返回 的 结果 与 游标 是 否 被 定义 为 
INSENSITIVE 有 关 。 假 设 这 个 事务 仅仅 是 执行 ， 不 必 关 心 并 发 事务 可 能 带 来 的 影响 。 
10.14 比较 嵌入 式 SQL、SQLPSM、JDBC、SQLJ 和 ODBC 状 态 处 理 (异常 处 理 ) 机 制 的 优点 和 缺点 。 


10.13 





第 11 章 数据 的 物理 组 织 和 索引 


SQL 最 大 的 优势 在 于 它 是 一 种 声明 性 的 语言 ， 一 个 SQL 语句 描述 的 是 关于 存储 在 数据 库 
中 信息 的 一 个 查询 ， 但 没有 定义 系统 执行 该 查询 所 使 用 的 技术 ， 具 体 使 用 何 种 技术 由 数据 库 
管理 系统 自身 来 决定 。 

这 样 的 技术 与 存储 结构 (storage structure )、 索 引 (index) 和 访问 路 径 (access path) 紧 
密 相 关 。 存 储 结构 是 定义 一 个 文件 里 表 中 行 的 特定 组 织 形式 。 索 引 是 附属 的 数据 结构 ， 可 能 
是 单独 存储 的 一 个 文件 ， 它 支持 对 表 中 行 的 快速 访问 。 访 问 路 径 是 指 访问 一 个 行 集合 的 特殊 
技术 。 它 使 用 一 种 基于 表 存 储 结构 的 算法 ， 或 基于 所 选择 的 表 上 可 用 的 索引 。 

关系 模型 的 一 个 重要 特性 是 ，SQEL 语 句 的 执行 结果 不 会 受到 执行 时 使 用 的 访问 路 径 的 影 
响 〈 也 就 是 说 ， 查 询 是 作用 在 数据 库 上 的 ， 由 数据 库 返回 查询 结 吉 果 的 信息 )， 所 以 ， 在 设计 查 
mn 程序 员 不 必 关 心 系 统 的 访问 路 径 。 

管 访问 路 径 的 选择 不 会 影响 查询 结果 ， 但 它 对 性 能 有 重要 的 影响 。 根 据 所 使 用 的 访问 
执行 时 间 可 能 从 几 秒 到 几 个 小 时 不 等 ， 特 别 是 查询 涉及 到 大 量 的 表 ， 而 这 些 表 中 有 几 
千 行 ， 或 者 成 千 上 万 行 时 更 是 如 此 。 而 且 ， 对 同一 个 表 的 查询 ， 不 同 的 访问 路 径 适 合 不 同 的 
SQL 语句 。 

因为 执行 时 间 对 访问 路 径 敏感 ， 所 以 大 多 数 数据 库 系统 允许 数据 库 设计 师 和 系统 管理 员 
自行 确定 每 一 个 表 的 访问 路 径 。 一 般 来 说 ， 管 理 员 会 根据 所 观察 到 的 各 种 SQL 语句 的 执行 频 


率 来 决定 。 
在 这 一 章 中 ， 我 们 描述 多 种 访问 路 径 ， 通 过 不 同 的 SQL 语句 的 执行 来 比较 它们 的 操作 性 能 。 
11.1 磁盘 组 织 


由 于 多 方面 的 原因 ， 数 据 库 通常 存储 在 大 容量 的 存储 设备 上 ， 而 不 是 存储 在 主 存 中 。 

容量 (size) ”描述 大 型 企业 的 数据 库 通常 包含 海量 信息 ，G 数 量 级 字 节 的 数据 库 是 不 足 
为 奇 的， 目前 已 存在 许多 T 数 量 级 字 节 的 数据 库 。 计 算 机 的 主 存 容纳 不 下 如 此 规模 的 数据 库 ， 
而 且 在 将 来 也 是 不 可 能 的 。 

代价 (cost) ”即使 数据 库 能 放 在 主 存 中 (例如 ， 当 数据 库 的 大 小 是 兆 数量 级 字 节 时 )， 通 
常 还 是 把 数据 库存 放 在 大 容量 的 存储 设备 上 9 ， 理 由 是 经 济 方 面 的 原因 ， 主 存 上 每 字 节 的 代 
价 比 磁 盘 上 每 字 节 的 代价 要 高 100 倍 。 : 

易 失 性 (volatility) ”在 第 2 章 ， 我 们 介绍 了 持久 性 的 概念 ， 这 是 与 事务 的 ACID 性 质 相关 
的 。 但 持久 性 不 仅仅 限于 事务 ， 它 也 是 数据 库 系统 的 一 个 重要 性 质 ， 即 使 在 系统 故障 的 情形 


O. 由 于 应 用 要 求 快速 的 响应 时 间 ， 数 据 库 通常 是 存储 在 主 存 中 的 ， 我 们 把 这 样 的 系统 称 为 主 存 数 据 库 系 统 


(main memory database system ) 。 





下 ， 描 述 企业 的 信息 也 必须 持久 地 保存 下 来 。 但 是 ， 大 多 数 主 存 中 的 信息 是 易 失 的 ， 即 在 断 
电 和 系统 崩溃 时 ， 主 存 中 的 信息 就 会 丢失 。 所 以 ， 本 质 上 来 讲 ， 主 存 不 能 满足 数据 库 疾 统 的 
要 求 。 而 另 一 方面 ， 大 容量 存储 器 中 的 信息 是 非 易 失 的 (nonvolatile )。 因 为 在 系统 故障 时 ， 
信息 仍然 能 保留 下 来 ， 所 以 ， 大 容量 存储 器 组 是 大 多 数 数据 库 系 统 的 基础 。 我 们 将 在 第 25 章 
予以 详细 介绍 。 

因为 存储 在 大 容量 存储 器 上 的 数据 是 不 能 被 系统 处 理 器 直接 访问 的 。 要 访问 数据 库 中 的 
数据 ， 首 先 必须 从 大 容量 存储 器 上 读数 据 到 主 存 中 的 缓冲 区 中 (此 时 ,两 种 存储 设备 上 都 有 
这 一 数据 的 拷贝 )， 然 后 对 缓存 中 的 数据 进行 操作 。 如 果 访 问 涉 及 对 数据 的 修改 ， 则 大 容量 存 
储 器 上 数据 的 拷贝 就 被 废弃 ， 必 须 将 缓存 中 的 数据 拷贝 写 回 存储 器 。 

最 第 用 的 大 容量 存储 器 是 磁盘 。 由 于 提高 一 个 数据 库 系 统 的 性 能 是 以 磁 趣 的 物理 特性 为 
基础 的 ， 所 以 为 理解 性 能 问题 ， 有 必要 回顾 一 下 磁盘 的 工作 方式 ; 

一 个 磁盘 单元 包含 一 个 或 多 个 圆 形 盘 片 (platter) ,这些 盘 片 固定 在 一 个 旋转 的 轴 上 ,如 
图 11-1 所 示 。 每 个 盘 片 的 一 面 或 者 两 面 涂 有 磁性 材料 ， 一 个 点 的 磁场 方向 决定 该 点 记录 的 是 0 
还 是 1。 因 为 信息 是 靠 磁 来 存储 的 ， 所 以 在 断 电 的 情况 下 信息 也 不 会 丢失 。 
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图 11-1 一 个 磁盘 存储 单元 的 物理 结构 


每 一 个 盘 片 或 表面 ) 通过 与 之 相连 的 读 / 写 头 (read/write head) 来 访问 ， 读 / 写 头 能 检 
测 和 设置 它 所 处 位 置 下 方 一 点 的 磁场 方向 。 读 / 写 头 与 一 个 读 / 写 辟 相连， 读 / 写 辟 沿 半径 广 
向 移动 ， 它 既 可 以 移 向 盘 片 的 圆心 ， 也 可 以 移 向 盘 片 的 边缘 。 由 于 盘 片 可 以 旋转 ， 所 以 读 / 写 
头 可 以 定位 于 盘面 上 方 的 任意 一 点 。 

事实 上 ， 数 据 是 存储 在 磁道 (track) 上 的 。 磁 道 是 盘 片上 的 同心 加 ,每 一 个 盘 片 有 相同 
的 磁道 数 N，N 是 固定 不 变 的 ， 所 有 人 盘 片 上 的 第 ;个 磁道 组 成 的 存储 区 域 称 为 第 ;个 柱 面 
(cylinder)。 因 为 每 个 盘 片上 都 有 一 个 读 / 写 头 ， 所 以 磁盘 单元 作为 一 个 整体 有 -组 读 / 写 头 ， 
读 / 写 稼 部 件 一 致 地 移动 所 有 的 读 / 写 头 。 所以， 在 某 个 给 定时 间 ， 所 有 读 / 写 头 定位 于 一 个 
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特定 柱 面 的 上 方 ， 看 起 来 好 像 能 同时 读 写 当 前 柱 面 的 所 有 磁道 。 但 是 ， 通 常 由 于 机 械 方面 的 
限制 ， 在 某 一 个 时 刻 只 允许 有 一 个 读 / 写 头 处 于 活动 状态 。 最 后 ， 每 一 个 磁道 被 分 为 多 个 扇 区 
(sector) ， 遍 区 是 能 被 硬件 传输 的 最 小 单元 。 

在 访问 一 个 特定 的 遍 区 之 前 ， 读 / 写 头 必须 定位 于 扇 区 起 始 处 的 上 方 ， 因 此 ， 访 问 一 个 扇 
区 S 的 时 间 可 分 为 三 部 分 : 

寻 道 时 间 (seek time) 读 / 写 臂 部 件 定位 于 包含 遍 区 $S 的 柱 面 上 方 所 用 的 时 间 。 

旋转 延迟 (rotational latency) 在读/ 写 璧 部 件 处 于 柱 面 的 上 方 后 ， 盘 片 必 须 旋 转 一 定 的 
角度 ， 使 得 读 / 写 头 定位 于 扇 区 S 开 始 处 的 上 方 。 

传输 时 间 (transfer time) 盘 片 旋转 经 过 扁 区 S 所 花费 的 时 间 。 

寻 道 时 间 取 决 于 沿 半径 方向 的 距离 ， 这 个 距离 是 当前 读 / 写 头 所 在 的 柱 面 到 读 / 写 扇 区 所 
在 柱 面 之 间 的 距离 。 在 最 坏 的 情况 下 ， 读 / 写 头 必须 从 第 1 道 移动 到 第 N 道 ; 在 最 好 的 情况 下 ， 
根本 不 需要 移动 。 如 果 磁 盘 请 求 均匀 地 分 布 在 柱 面 上 ， 按 它们 到 达 的 先后 顺序 进行 服务 ， 那 
么 可 以 证 明 ， 寻 道 平 均 要 跨越 的 磁道 数 大 约 是 W3s 。 寻 道 时 间 通 常 是 这 三 种 时 间 中 最 长 的 ， 
因为 它 不 仅 涉及 机 械 移 动 ,而且 还 包括 克服 读 / 写 辟 部 件 在 启动 和 停止 时 克服 惯性 所 用 的 时 间 。 

旋转 延迟 仅 次 于 寻 道 时 间 。 平 均 来 说 ， 旋 转 延 迟 是 绕 盘 片 旋 转 一 周 所 用 时 间 的 一 半 。 其 
中 同样 也 包括 机 械 移动 ， 不 过 在 这 种 情形 下 ， 人 惯性 不 是 问题 。 传 输 时 间 受 旋转 时 间 的 限制 。 
一 个 磁盘 所 支持 的 传输 率 是 在 某 处 读 / 写 头 一 次 能 够 传输 数据 的 速率 ， 这 取决 于 盘 片 的 旋转 速 
度 和 盘 片 表面 的 位 密度 。 术 语 延 迟 (latency) 是 指定 位 读 / 写 头 和 访问 盘 片 所 用 时 间 的 总 和 。 
所 以 延迟 是 寻 道 和 旋转 延迟 时 间 之 和 。 

一 个 典型 的 磁盘 能 存储 G 数 量 级 字 节 的 数据 ， 磁 盘 中 一 个 扇 区 的 大 小 为 5312B ， 平 均 寻 道 
时 间 是 5 ~ 20ms， 平 均 旋 转 延 迟 是 2 ~ 10ms， 每 秒 的 传输 率 是 几 兆 字 节 ， 所 以 通常 情况 下 ， 访 
问 一 个 记 区 的 时 间 是 20 毫 秒 级 。 

磁盘 的 物理 特性 决定 两 个 遍 区 之 间 的 距离 ， 它 是 度量 访问 延迟 的 尺度 。 如 果 相 同 磁道 上 
的 两 个 扇 区 相 邻 ， 此 时 遍 区 之 间 的 距离 最 小 ， 因 为 如 果 连 续 地 读 这 两 个 扁 区 ， 则 时 间 延 迟 为 
零 。 按 距离 增加 的 顺序 ， 在 同一 柱 面 ， 同 一 磁道 上 的 两 个 遍 区 相距 最 近 。 对 不 同 的 柱 面 ， 如 
果 | nn, | < | ns—na | > WW kin, Fin. EADS 区 之 间 的 距离 比 磁道 a 和 ns 上 扇 区 之 间 的 距离 小 。 

从 一 个 磁盘 单元 的 物理 特性 ， 我 们 可 以 得 出 下 列 结论 : 

。 最 重要 的 是 ， 和 CPU 相 比 ， 磁 盘 是 一 种 低速 设备 。CPU 可 以 利用 访问 一 个 扇 区 的 时 间 执 

行 成 百 上 千 条 指令 。 因 此 ， 在 试图 优化 一 个 数据 库 系 统 的 性 能 时 ， 有 必要 优化 主 存 和 磁 
盘 之 间 的 信息 流 。 与 优化 磁盘 流量 所 获得 的 性 能 相 比 ， 数 据 库 使 用 有 效 的 算法 处 理 数 据 
所 提高 的 性 能 是 微不足道 的 。 认 识 到 这 一 点 后 ， 当 在 后 续 章节 讨论 访问 路 径 时 ， 我 们 通 
过 估计 I1/O 操 作 来 评价 性 能 ， 而 忽略 处 理 器 所 用 的 时 间 。 

* 在 访问 记录 Ai 后 很 可 能 访问 记录 A: 的 实际 应 用 中 ， 如 果 存 储 A; 的 遍 区 和 A: 的 扇 区 的 距离 
By, 则 时 间 延 迟 就 越 小 。 所 以 ,应 用 程序 的 性 能 受 磁盘 上 数据 的 物理 存储 方式 的 影响 。 
例如 ， 如 果 一 个 表 存 储 在 一 个 磁道 上 或 一 个 柱 面 上 上， 那么 对 这 个 表 进 行 顺序 扫描 就 能 高 


日 ”该 问题 用 算术 方式 可 描述 为 : 假设 有 一 间隔 ， 在 间隔 内 任意 地 放置 两 个 标记 ， 这 两 个 标记 平均 相距 多 远 ? 
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* 为 简化 缓冲 区 的 管理 ， 数 据 库 系统 的 每 次 IO 操作 传输 相同 的 字 节 数 。 那 么 每 次 传输 多 

少 字 节 呢 ? 根据 以 前 所 记录 的 数字 ， 和 平均 延迟 相 比 ， 传 输 一 个 扇 区 所 花 的 时 间 明 显 地 

要 小 得 多 ， 即 使 每 次 MO 操作 传输 多 个 扇 区 ， 这 个 结论 也 是 正确 的 。 尽 管 从 物理 的 角度 

来 讲 ， 一 般 的 传输 单位 是 处 在 一 个 扇 区 上 的 数据 ， 但 如 果 系 统 能 够 传输 更 大 单元 上 的 数 

据 ， 这 可 能 会 更 加 有 效 。 

页 (page) 通常 指 每 次 1/O 操 作 所 传输 的 数据 单位 ， 页 在 磁盘 上 是 以 一 个 磁盘 块 ( 简称 
Atk) 的 形式 存储 的 ， 一 个 块 是 一 个 磁道 上 顺序 存储 的 多 个 相 邻 扁 区 ， 页 的 大 小 和 这 
个 块 的 大 小 相等 。 一 次 VO 操作 能 传输 一 页 ， 只 需 一 次 时 间 延 迟 来 将 读 / 写 头 定位 于 包 
含 该 块 的 起 始 处 ， 因 为 在 这 里 没有 必要 将 读 / 写 辟 或 盘 片 从 块 的 一 个 扁 区 移动 到 下 一 个 
CREE ti. 

TITAS Hr pb Be Be PER HA a Be ( 即 页 的 大 小 )。 当 一 个 特定 的 应 用 访问 表 中 记录 
A 时 ， 应 用 很 可 能 会 访问 表 中 与 A 相 邻 的 另 一 条 记录 (如 果 表 被 经 常 扫描 ， 那 么 实际 情 
况 可 能 就 是 这 样 )， 因 此 页 应 足够 大 ， 以 便 能 容 得 下 这 些 额 外 的 记录 从 而 避免 对 磁盘 的 
另 一 次 访问 。 另 一 方面 ， 随 着 页 面 的 增 大 ， 传 输 时 间 会 增加 ， 大 的 页 面 要 求 内 存 中 有 
大 的 缓冲 区 。 因 此 ， 太 大 的 页 面 也 是 不 可 取 的 ， 因 为 这 可 能 大 大 地 超出 与 A 相 邻 的 实际 
要 访问 的 信息 。 综 合 以 上 的 考虑 ， 一 个 典型 页 面 的 大 小 是 4096B (4KB )。 注 意 ， 我 们 
要 讨论 的 是 减少 延迟 和 寻 道 时 间 。 在 这 种 情况 下 ， 这 样 大 小 的 页 是 合适 的 ， 它 能 将 相 
关 的 信息 包含 在 相同 的 页 和 连续 的 扁 区 上 (它们 之 间 的 距离 为 0 ) 。 

在 主 存 中 ， 系 统 维护 着 一 组 页 面 大 小 的 缓冲 区 ， 称 为 高 速 缓存 (cache )。 当 应 用 请 求 访 
问 表 的 一 个 特定 记录 A 时， 对 页 进行 LO 操作 ， 会 有 下 列 事件 要 发 生 。 我 们 假设 每 一 个 表 存 储 
在 一 个 数据 文件 (data file) 中 。 首 先 ， 数据库 系统 检测 文件 ， 确 定 哪 一 页 包含 记录 A1， 然 后 
将 这 一 页 从 大 容量 的 存储 设备 传输 到 高 速 缓存 的 一 个 缓冲 区 中 (我 们 立即 对 这 部 分 描述 进行 
修改 )， 在 后 来 的 某 个 时 间 (通常 是 由 大 容量 存储 设备 的 中 断 信号 来 标识 )， 系 统 确认 传输 已 
经 完成 ， 就 将 A) 从 缓冲 区 的 页 拷贝 到 应 用 程序 中 。 

由 于 几 个 方面 的 原因 ， 系 统 试图 将 页 在 缓冲 区 中 保存 一 段 时 间 。 第 一 ， 应 用 可 能 以 后 要 
允 记 录 A, 进 行 修改 ， 这 样 缓冲 区 中 Ai 的 拷贝 必须 进行 相应 的 修改 (缓冲 区 中 的 其 他 记录 保持 
不 变 )， 缓 冲 区 的 内 容 要 用 来 修改 大 容量 存储 设备 上 的 页 。 

第 二 ， 应 用 (或 其 他 某 个 应 用 ) 可 能 请 求 访问 这 个 表 中 的 另外 一 条 记录 Az。 如 果 A: 和 A， 
处 在 相同 的 页 ， 则 系统 无 需 额外 的 IO 操作 就 能 返回 一 个 拷贝 (明显 的 成 功 之 处 )。 数 据 库 系 
统 在 执行 IO 操作 之 前 ， 总 是 先 搜索 高 速 缓存 来 试图 满足 应 用 的 数据 库 访问 请 求 (这 就 是 我 们 
前 面 所 说 的 修改 )。 

当 在 高 速 缓存 中 发 现 请 求 的 页 时 ， 这 个 事件 称 为 一 次 高 速 缓 存 命中 (cache hit), Bits 
大 化 高 速 缓存 命中 率 ， 有 可 能 极 大 地 提高 系统 的 性 能 。 因 此 ， 应 该 关注 高 速 缓存 中 缓冲 区 
(有 限 数量 的 缓冲 区 ) 的 管理 。 当 高 速 缓 存 满 (因为 高 速 缓 存 早晚 一 定 会 满 7， 必须 提取 新 页 
时 ， 应 该 清空 高 速 缓存 中 的 哪个 缓冲 区 昵 ? 解决 此 问题 常用 的 一 个 算法 是 最 近 最 少 使 用 算法 
(Least Recently Used，LRU)， 它 清空 最 长 时 间 没 被 引用 的 页 面 所 在 的 缓冲 区 。 这 一 设想 是 基 
于 最 近 被 引用 的 页 是 活动 的 ， 它 在 不 久 的 将 来 被 再 次 引用 的 概率 很 高 ， 所 以 这 个 页 应 保存 在 
高 速 缓存 中 。 
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11.2 堆 文 件 


我 们 假设 每 一 个 表 按 照 某 种 存储 结构 存储 在 不 同 的 文件 中 ， 其 中 最 简单 的 存储 结构 是 堆 
文件 (heap file)。 使 用 堆 文 件 ， 新 产生 的 行 能 有 效 地 追加 在 文件 的 尾部 。 因 此 ， 文 件 中 行 的 
顺序 是 任意 的 。 没 有 专门 的 规则 来 限制 特定 的 行 应 放 在 什么 位 置 。 图 11-2 是 表 TRANSCRIPT 以 堆 
文件 方式 存储 的 物理 图 表示 。 这 个 表 共 有 四 列 : Studld、CrsCode、Semester 和 Grade。 我 们 已 
经 修改 了 表 的 模式 ， 以 便 Grade 能 存储 实数 ， 我 们 还 假设 一 个 页 面 能 容纳 四 行 。 






666666666 MGT123 






















































123454321 C8305 第 0 页 
987654321 CS305 

1111141141 MGT123 

123454321 CS315 

666666666 EE101 第 1 页 
123454321 MAT123 

234567890 EE101 

234567890 CS305 

111114111 EE101 第 2 页 
111111111 MAT123 

987654321 MGT123 

425360777 CS305 S1996 

666666666 MAT123 F1997 第 3 页 





图 11-2 以 堆 文件 方式 存储 的 TRANSCRIPT 表 


迄今 为 止 ， 我 们 所 关心 的 是 堆 文 件 的 行 是 无 序 的 ， 这 是 堆 文件 最 重要 的 特征 。 我 们 忽略 
一 些 重要 的 问题 ， 因 为 它们 是 数据 库 系统 内 部 机 制 的 问题 ， 程 序 员 通常 无 法 控制 这 些 问 题 。 
但 我 们 必须 知道 这 些 是 什么 样 的 问题 。 例 如 ， 我 们 假设 在 图 11-2 中 ， 所 有 的 行 有 相同 的 长 度 ， 
所 以 每 一 个 页 面容 纳 的 行 数 相 同 。 但 事实 却 不 一 定 是 这 样 。 例 如 ， 如 果 与 某 列 相关 的 域 是 
VARCHAR(3000)， 用 于 存储 这 列 中 的 字 节 数 从 1 ~ 3000 不 等 。 因 此 ， 一 页 所 能 容纳 的 行 数 是 
不 定 的 ， 这 使 得 存储 分 配 变 得 十 分 复杂 。 通 常 ， 不 论 行 是 定 长 还 是 不 定 长 ， 每 一 个 页 面 必 须 
格式 化 ， 使 之 包含 一 定数 量 的 头 信息 ， 头 信息 指明 页 面 中 每 一 行 的 起 始点 和 页 面 中 未 被 使 用 
的 区 域 。 我 们 假设 一 个 数据 文件 中 一 行 的 逻辑 地 址 是 由 行 的 ID(rid) 给 出 的 ， 这 个 ID 包 含 这 行 
在 该 文件 中 的 页 数 (page number) 和 行 数 (slot number)。 行 的 实际 位 置 是 通过 解析 使 用 页 的 
头 信息 的 行 数 信息 来 确定 的 。 当 一 行 太 长 ， 一 个 页 面容 纳 不 下 时 ， 这 会 变 得 更 加 复杂 。 

堆 文件 的 优点 是 它 的 简单 性 ， 行 揪 入 后 直接 追加 在 文件 的 尾部 ， 行 删除 是 通过 将 它 所 在 
页 面 的 头 信息 定义 为 空 来 完成 的 。 把 图 11-2 中 的 ID 为 111111111 的 学 生 删 除 ，ID 为 666666666 
的 学 生 在 1998 年 的 春季 修 完 CS305 后 的 记录 插入 就 得 到 图 11-3。 注 意 ， 删 除 后 在 文件 中 留 下 了 
空隙， 最 终 会 浪费 很 多 的 存储 空间 。 由 于 要 检查 很 多 不 必要 的 页 ， 这 些 空 陵 使 得 文件 的 搜索 
时 间 变 长 。 最 终 这 些 空隙 会 扩展 到 必须 压缩 文件 的 地 步 ， 当 文件 很 大 时 ， 压 缩 是 一 个 很 费时 
的 过 程 ， 因 为 不 仅 必 须 对 每 一 页 进行 读 操作 ， 还 必须 对 所 压缩 的 页 面 进行 写 操作 。 
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666666666 | MGT123 
123454321 | CS305 第 0 页 
987654321 | CS305 
123454321 | CS315 
666666666 | EE101 第 1 页 
123454321 | MAT123 
234567890 | EE101 
234567890 

第 2 页 
987654321 | MGT123 
425360777 | CS305 
666666666 | MAT123 第 3 页 
666666666 | CS305 








图 11-3 在 图 11-2 中 插入 和 删除 一 些 行 后 的 TRANSCRIPT 表 


通过 计算 完成 其 他 文件 操作 所 需 的 1/O 操 作 数 ， 我 们 可 以 比较 堆 文 件 和 其 他 存储 结构 文件 
的 访问 效率 ， 这 是 我 们 后 面 要 讨论 的 内 容 。 用 F 表 示 一 个 文件 中 的 页 数 。 首 先 来 看 插入 操作 。 
在 插入 一 行 A 时 ， 我 们 必须 确保 A 的 键 不 会 与 表 中 已 有 行 的 键 相同 。 如 果 存 在 相同 的 键 ， 可 能 
平均 要 读 F/2 个 页 面 ， 然 后 放弃 插入 操作 。 为 得 出 没有 相同 键 值 存在 的 结论 ， 必 须 读 整 个 文件 ， 
然后 重 写 最 后 一 页 (插入 A)。 在 这 种 情况 下 ， 总 的 代价 是 传输 F+1 个 页 面 。 

删除 的 情形 与 此 类 似 。 对 一 个 有 特定 键 值 的 元 组 A， 平 均 要 读 F/2 个 页 面 才能 找到 它 ， 
然后 重 写 这 个 页 面 (A 被 删除 )， 代 价 是 F/2+1。 如 果 不 存在 这 样 的 元 组 ， 代 价 将 是 F。 如 果 
指定 被 删除 的 元 组 的 条 件 不 涉及 键 ， 就 必须 扫描 整个 文件 ， 因 为 在 表 中 可 能 存在 多 个 满足 


条 件 的 行 。 
如 果 对 
的 存储 结构 


SELECT 
FROM 


返回 整个 表 


表 的 查询 涉及 访问 所 有 的 行 ， 且 行 的 访问 显 序 并 不 重要 ， 和 那么 堆 文件 是 一 种 有 效 
。 例 如 ， 查 询 | 


* 
TRANSCRIPT 


。 对 一 个 堆 存储 结构 ， 代 价 是 FE， 显 然 这 是 一 种 理想 的 状态 。 当 然 ， 如 果 我 们 想 将 


行 按 某 种 顺序 打印 出 来 ， 代 价 会 更 大 。 因 为 在 输出 之 前 ， 必 须 先 将 行 排 序 。 这 样 的 一 个 查询 


例子 是 : 


SELECT 
FROM 


水 
TRANSCRIPT T 


ORDER BY T.StudId 


作为 另外 的 一 个 例子 ， 考 虑 下 面 的 查询 : 


SELECT 
FROM 


AVG(T.Grade) 
TRANSCRIPT T 
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它 返 回 所 有 指定 课程 的 平均 成 绩 。 不 管 表 是 如 何 存储 的 ， 都 必须 读 取 表 中 所 有 行 来 提取 成 绩 
值 。 在 读 取 表 中 的 行 时 ， 平 均 数 的 计算 与 顺序 无 关 。 其 代价 为 F， 这 也 是 最 优 的 。 
假设 一 个 查询 要 求 找 出 ID 为 234567890， 在 1996 年 春季 所 修 课程 为 CS305 的 学 生 的 成 绩 : 
SELECT T.Grade 
FROM TRANSCRIPT T 


WHERE T.StudId = '234567890' AND (11.1) 
T.CrsCode = 'CS305' AND T.Semester = 'S1996' 


因为 {StudId,CrsCode,Semester} 是 表 TRANSCRIPT 的 键 ， 所 以 最 多 只 返回 一 个 成 绩 。 如 果 表 
TRANSCRIPT 的 值 如 图 11-2 所 示 ， 那 么 将 返回 一 个 确切 的 成 绩 (namely,4.0)。 数 据 库 系统 必须 扫 
描 文 件 的 页 面 来 查找 具有 特定 键 的 行 ， 并 返回 相应 的 成 绩 ， 在 这 种 情况 之 下 ， 必 须 读 取 三 个 
页 面 。 一 般 情况 下 ， 必 须 平均 读 取 F/2 个 页 面 ， 但 如 果 有 特定 键 的 行 不 在 表 中 ， 就 必须 读 取 所 
有 EF 个 页 面 。 不 论 哪 一 种 情形 ， 考 虑 到 实际 请 求 访问 的 信息 量 ， 其 代价 都 是 很 高 的 。 

最 后 ， 考 虑 下 面 的 查询 ， 第 一 个 查询 返回 JP 为 234567890 的 学 生 的 课程 、 学 期 和 所 有 课程 
的 成 绩 ， 第 二 个 查询 返回 所 有 某 些 课 程 的 成 绩 位 于 2.0 ~ 4.0 的 学 生 的 ID 。 因 为 在 这 两 种 情况 之 
下 ，WHERE 子 句 都 没有 指定 一 个 候选 律 ， 所 以 可 能 返回 任意 多 个 行 。 因 此 ， 整 个 表 的 搜索 代 
价 是 F。 l 


SELECT T.Course, T.Semester, T.Grade 
FROM TRANSCRIPT T (11.2) 
WHERE T.StudId = '234567890' 


SELECT T.StudId 
FROM TRANSCRIPT ` oo (11.3) 
WHERE T.Grade BETWEEN 2.0 AND 4.0 


在 语句 (11.1) 和 (11.2) 中 ，WHERE 子 句 中 的 条 件 是 相等 条 件 ， 因 为 所 请 求 的 元 组 必须 有 
特定 的 属性 值 。 查 找 满足 相等 条 件 元 组 被 称 为 等 值 查找 (equality search)。 语 句 (11.3) 中 的 
WHERE 子 句 的 条 件 是 一 个 范围 条 件 (range condition)， 它 涉及 一 个 属性 ,属性 的 域 是 有 序 的 ， 
所 有 属性 值 在 特定 范围 的 行 都 被 检索 出 来 ， 在 条 件 范围 内 ， 并 没有 指定 元 组 实际 的 属性 值 ， 
一 个 满足 范围 条 件 的 查询 称 为 范围 查找 (range search). 


11.3 排序 文件 


最 后 的 两 个 例子 (11.2 和 11.3) 说 明了 堆 文 件 的 缺点 。 即 使 请 求 访 问 的 信息 是 一 个 行 子 集 
的 情况 下 ， 也 必须 查找 整个 表 。 因 为 不 扫描 一 个 页 ， 我 们 就 不 能 确定 它 是 否 包含 结果 子 集 的 
一 行 。 这 些 例子 提出 开发 更 好 的 存储 结构 的 需求 ， 其 中 之 一 就 是 本 节 我 们 所 要 讨论 的 结构 。 

假设 我 们 不 是 在 表 中 以 任意 的 顺序 存储 各 行 ， 而 是 按 表 中 某 些 属性 上 的 值 进行 排序 ， 我 
们 称 这 样 的 结构 为 排序 文件 (sorted file)。 例 如 ， 我 们 可 以 将 表 TRANSCRIPT 存 储 在 一 个 索引 文 
件 中 ， 表 中 的 各 行 是 按 StudId 排 序 的 ， 如 图 11-4 所 示 。 为 查找 满足 (11.2) 的 条 件 的 数据 记录 ， 
一 个 简单 的 方法 就 是 顺序 扫描 记录 ， 直 到 找到 第 一 个 StudId 为 234567890 的 记录 为 止 。 所 有 包 
含 这 样 值 的 记录 是 连续 存储 的 ， 所 以 访问 它们 所 需 的 VO 开销 最 小 。 特 别 地 ， 如 果 连 续 的 页 在 
磁盘 上 邻近 地 存放 ， 则 可 以 使 寻 道 时 间 最 小 化 。 在 图 中 ， 描 述 学 生 234567890 所 修 课程 的 行 
储 在 一 个 页 面 上 。 一 旦 这 些 行 的 第 一 个 记录 在 高 速 缓 在 中 可 用 ， 那 么 所 有 其 他 满足 查询 条 件 








(11.2) 的 记录 就 能 被 迅速 检索 出 来 。 如 果 数 据 文件 包含 F 个 页 面 ， 为 定位 记录 ， 平 均 要 对 F/2 
个 页 面 进行 O 操 作 。 和 存储 在 堆 文件 中 的 表 TRANScRIPT 相 比 ， 性 能 得 到 有 效 的 改善 。 注 意 ， 
同样 的 方法 也 适用 于 查询 (11.1). 






















































































411111111 | MGT123 
111111111 | EE101 第 0 页 
111111111 | MAT123 

123454321 | CS305 

123454321 | CS315 4.0 第 1 页 
123454321 | MAT123 | s1996 | 2.0 
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425360777 | CS305 $1996 

666666666 | MGT123 
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987654321 | MGT123 | Fi994 | 3.0 

987654321 | CS305 第 4 页 


















图 11-4 作为 索引 文件 存储 的 TRANSCRIPT 表 


在 某 些 情况 下 ， 使 用 二 分 查找 (binary search) 技术 会 更 加 有 有效。 首先 检索 处 在 中 间 的 
页 ， 把 它 的 1d 值 和 234567890 相 比较 。 如 果 目 标 值 在 这 个 页 面 中 ， 则 查找 成 功 。 如 果 目 标 值 
小 于 (或 者 大 于 ) 页 面 的 Id 值 ， 则 在 这 个 数据 文件 的 前 一 半 上 (或 后 一 半 上 ) 递归 地 重复 这 
一 过 程 。 使 用 这 一 方法 ， 在 最 坏 的 情况 下 ， 定 位 一 个 特定 学 生 的 Id 需 传 输 的 页 面 数 大 约 是 
log.F. - 

传输 的 页 面 数 并 不 一 定 能 反映 查找 一 个 排序 文件 的 实际 开销 。 而 使 用 二 分 查找 法 ， 我 们 
可 能 要 访问 磁盘 中 不 同 柱 面 上 的 页 ， 这 可 能 会 产生 相当 大 的 寻 道 延迟 开销 。 实 际 上 ， 在 某 些 
情况 下 ， 寻 道 延迟 可 能 是 主要 的 开销 。 考 虑 一 个 占用 N 个 连续 柱 面 的 索引 文件 。 其 中 ， 连 续 的 
页 存储 在 相 邻 的 块 中 ， 利 用 二 分 查找 法 可 能 先 让 磁盘 头 移动 的 距离 是 N/2 个 柱 面 ， 然 后 是 N/4 
个 柱 面 ， 接 着 是 N/8 个 柱 面 ， 依 此 类 推 。 磁 盘 头 跨越 的 总 的 柱 面 数 大 约 是 N 个 ， 所 以 二 分 查找 
法 总 的 开销 将 是 : 

N x 寻 道 时 间 +logJF x 传输 时 间 

另 一 方面 ， 如 果 我 们 对 文件 作 简单 的 顺序 查找 ， 磁 盘 头 平均 跨越 的 柱 面 数 将 是 N/2， 总 开 
销 为 : 

N/2 x 导 道 时 间 +F/2 x 传输 时 间 
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由 于 传输 时 间 中 ， 寻 道 时 间 占 很 大 一 部 分 ， 所 以 只 有 在 F 远 远大 于 N 时 。 ， 二 分 查找 才 更 有 效 
率 。 纵 观 这 些 结 论 ， 对 索引 文件 的 等 值 查找 而 言 ， 顺 序 查找 和 二 分 查找 都 不 是 最 佳 选 择 。 一 
个 更 常用 的 方法 是 使 用 索引 (参见 下 一 节 ) 对 索引 文件 进行 补充 ， 然 后 在 索引 上 使 用 二 分 查 
找 法 。 因 为 可 设计 索引 使 之 适 于 放 在 主 存 中 ， 对 索引 实施 二 分 查找 是 非常 有 效 的 ， 不 会 遇 到 
前 面 所 描述 的 磁盘 延迟 开销 。 

如 果 文 件 是 在 请 求 查找 的 同一 属性 上 排序 的 ， 那 么 它 也 支持 范围 查找 。 因 此 ， 图 11-4 所 
示 的 TRANSCRIPT 文 件 支持 这 样 的 查询 : 查找 ID 处 在 100000000 和 199999999 之 间 的 学 生 信 息 。 
在 这 一 范围 内 、 一 个 查找 ID 为 100000000 的 等 值 查找 定位 该 范围 中 的 第 一 个 元 组 〈 可 能 有 ID 
为 100000000 的 元 组 ， 也 可 能 这 样 的 元 组 不 存在 ， 此 时 元 组 的 最 小 ID 大 于 这 个 值 )。 这 一 范围 
内 后 续 的 元 组 存储 在 连续 的 槽 内 ， 在 它们 被 检索 时 ， 很 可 能 就 会 被 高 速 缓存 命中 。 如 果 B 是 存 
储 在 一 页 中 的 行 数 ，R 是 一 特定 范围 内 的 行 数 ， 那 么 为 检索 数据 文件 中 包含 在 这 一 范围 内 (一 
且 第 一 行 被 定位 后 ) 的 行 所 需 的 MO 操作 数 大 约 是 R/B。 

把 这 些 数 字 和 堆 文件 的 数字 相 比较 。 在 堆 文件 中 ， 某 一 范围 内 的 行 可 能 处 在 不 同 的 页 面 ， 
为 定位 所 有 这 些 记 录 ， 有 必要 扫描 整个 文件 。 若 数据 文件 有 EF 个 页 面 ， 则 IO 操作 数 为 E。 类 似 
地 ， 索 引文 件 支持 满足 (11.3) 条 件 的 元 组 检索 ， 尽 管 在 这 种 情况 之 下 ， 表 必须 在 Grade 上 建 
立 索 引 ， 但 不 能 同时 在 两 个 查找 键 上 建立 索引 。 

实际 上 ， 如 果 表 是 动态 变化 的 ， 那 么 保持 行 索引 有 序 是 很 困难 和 的 。 当 插入 新 行 时 ， 数 据 
文件 中 插入 点 后 面 所 有 的 行 都 要 向 下 移动 一 个 存储 档 (平均 要 更 新 一 半 的 页 面 )， 这 要 付出 沉 
重 的 IO 代价 。 解 决 这 个 问题 的 一 个 〈 部 分 ) 办 法 就 是 : 在 建立 数据 文件 时 ， 为 容纳 以 后 要 在 
行 之 间 揪 入 的 记录 ， 在 每 一 页 留 出 一 些 空 的 存储 槽 。 术 语 装填 因子 (fillfactor) 是 指 一 个 页 面 
在 初始 状态 存储 槽 被 填 满 的 百分比 。 例 如 ， 在 一 个 堆 文件 中 ， 装 填 因 子 是 100%。 在 图 11-4 中 ， 
装填 因子 是 75% ， 因 为 一 个 页 面 中 的 4 个 存储 槽 只 填 满 3 个 。 

但 增加 空 的 存储 槽 不 能 完全 解决 问题 ， 因 为 在 行 被 插入 时 ， 它 们 可 能 会 被 耗 光 。 在 后 续 
行 插入 时 ， 又 出 现 同样 的 问题 。 滋 出 页 (overflow page) 可 用 于 这 种 情形 ， 如 图 11-5 所 示 的 
TRANSCRIPT 表 。 我 们 假设 数据 文件 的 初始 状态 如 图 11-4 所 示 ， 每 一 页 有 一 个 指针 字段 ， 它 包含 
溢出 页 的 页 号 (如果 存在 的 话 )。 在 创建 文件 后 ， 在 第 2 页 中 插入 新 的 两 行 。 如 果 溢 出 页 自身 
溢出 ， 我 们 可 以 创建 一 个 洲 出 链 (overflow chain )， 即 一 个 链接 所 有 溢出 页 的 链表 。 

在 使 用 洲 出 链 来 使 文件 逻辑 排序 (logically sorted) 时 ， 却 失去 索引 文件 连续 存储 在 磁盘 
空间 上 的 优点 ， 因 为 溢出 页 可 能 和 与 之 相 链 接 的 页 相距 很 远 。 这 就 导致 顺序 扫描 读 取 记 录 中 
产生 额外 时 间 延 迟 ， 因 此 传输 某 一 范围 内 记录 的 MO 操作 数 不 再 是 RMB。 如 果 顺 序 扫描 的 性 能 
非常 重要 (实际 就 是 这 样 ) ， 必 须 定期 重新 组 织 数 据 文件 ， 以 确保 所 有 的 记录 在 磁盘 空间 上 是 
毗邻 存储 的 。 这 里 的 教训 是 : 如 果 文 件 是 动态 的 ， 维 持 一 个 数据 文件 索引 有 序 要 付出 代价 。 


11.4 索引 


假设 你 为 一 个 应 用 建立 一 个 数据 库 ， 以 供 一 组 用 户 使 用 。 但 你 不 仅 没 有 收 到 相应 的 回报 ， 
反而 从 用 户 那 里 收 到 许多 系统 太 慢 的 报 忽 电话 ， 这 会 使 你 非常 生气 。 一 些 用 户 声称 ， 他 们 要 


后 ”我 们 忽略 了 旋转 延迟 ， 和 二 分 查找 相 比 ， 它 能 更 好 地 支持 顺序 查找 。 
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等 很 长 时 间 才 得 到 查询 的 响应 。 还 有 一 些 用 户 声称 ， 输 出 结果 是 不 可 接受 的 ， 提 交 查 询 的 速 
率 远 远大 于 系统 所 能 处 理 的 能 力 。 
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图 11-5 在 作为 索引 文件 存储 的 TRANSCRIPT 表 中 增加 几 行 


索引 可 用 来 改善 这 种 情况 。 表 上 的 一 个 索引 类 似 于 一 本 书 的 索引 ， 或 者 类 似 于 图 书馆 的 
分 类 卡 。 对 一 本 书 来 说 ， 读 者 感 兴趣 的 术语 被 挑选 出 来 组 成 索引 条 目 ， 每 一 个 索引 条 目 
(index entry) 包含 一 个 术语 〈 例 如 “gas turbines”) 和 一 个 指针 (如 “P.348”)， 指 针 用 来 定 
位 术语 在 书 中 出 现 的 位 置 。 这 些 条 目 同时 按 术 语 进行 排序 ， 从 而 构成 一 个 表 ， 称 为 一 个 索引 
(index )。 在 讨论 某 个 术语 时 ， 不 是 去 扫描 整 本 书 ， 而 是 先 访问 索引 ， 然 后 直接 找到 术语 出 现 
的 地 方 。 : 

这 与 分 类 卡 的 情形 更 加 接近 。 在 分 类 卡 中 ， 可 能 有 基于 书 的 不 同属 性 而 制 成 的 多 个 索引 : 
作者 ， 书 名 ,科目 。 在 每 个 索引 中 ， 条 目 是 按 属性 值 排序 的 ， 每 个 条 目 指 向 书库 中 的 一 本 书 。 
因此 ， 作 者 索引 中 的 条 目 包含 作者 的 姓名 和 指针 (如 section、shelf)， 它 指向 作者 所 写 的 一 本 书 。 





FUE REHMBARKREII 253 


类 似 地 ， 数 据 库 表 上 的 索引 提供 一 种 便利 的 方法 来 定位 某 一 行 〈 数 据 记录 )， 而 不 必 扫 描 
整个 表 ， 因 而 可 以 大 大 地 节约 处 理 查 询 的 时 间 。 用 来 定位 的 属性 是 索引 表 中 称 为 查找 键 
(search key) 的 一 列 (或 几 列 )。 注意 , 不 要 把 一 个 表 上 索引 的 查找 键 和 表 上 的 候选 键 相 混淆 。 
记 住 ， 一 个 候选 键 是 一 列 或 几 列 的 集合 ， 它 有 这 样 的 属性 ， 即 任何 表 中 的 实例 ， 没 有 两 行 在 
这 些 列 上 的 值 是 相等 的 。 查 找 键 就 没有 这 样 的 限制 ， 因 此 ， 表 中 可 有 多 个 学 生 ID 为 111111111 
的 行 ， 这 意味 着 StudId 上 的 索引 有 多 个 索引 条 目 ， 每 个 条 目的 查找 键 值 都 为 111111111。 

和 候选 键 一 样 ， 一 个 查找 键 可 能 涉及 几 列 ， 例 如 ， 查 找 键 可 能 包括 学 生 的 Studld 和 
Semester。 但 又 和 候选 键 不 同 ， 在 查找 键 中 ， 列 顺序 是 不 同 的 ， 所 以 把 索引 表 中 的 查找 键 看 
成 是 列 的 一 个 顺序 序列 (和 一 个 集合 相对 照 )， 在 我 们 讨论 部 分 键 查找 时 ， 你 会 发 现 它们 的 顺 
序 是 非常 重要 的 。 

索引 是 由 一 组 索引 条 目 和 基于 一 个 查找 键 





值 来 有 效 地 定位 某 个 条 目的 机 制 所 组 成 的 。 对 定位 索引 基 
某 些 索引 ， 如 ISAM 索 引 和 B'* 树 、 定 位 机 制 依 roams 
赖 于 索引 条 目 在 查找 键 上 有 序 的 事实 。 散 列 索 

引 采用 不 同 的 方法 。 在 这 两 种 情况 中 ， 支 持 定 

位 机 制 的 数据 结构 和 索引 条 目 都 被 集成 为 数据 
文件 包含 在 表 中 ， 如 图 11-6 所 示 。 这 种 集成 后 eda 
的 数据 文件 被 看 作 一 种 新 的 存储 结构 。 以 后 我 

们 所 要 讨论 的 ISAM、B' 树 ， 以 及 散 列 存储 结 

构 ， 都 可 以 作为 维 文件 和 有 序 存储 结构 的 一 种 e 

社 代 。 利 用 集成 的 存储 结构 ， 每 条 索引 实际 包 
含 表 的 一 行 (不 需要 指针 )。 图 11-6 索引 与 数据 记录 集成 在 


一 起 的 存储 结 
另外 , 索引 可 以 存储 在 一 个 单独 的 文件 中 ， 起 的 存储 结构 


该 文件 称 为 索引 文件 (index file), 文件 中 的 每 条 索引 包含 一 个 查找 键 和 一 个 ride ， 这 种 组 织 
形式 如 图 11-7 所 示 。 例 如 ， 图 11-2 所 示 的 TRANSCRIPT 表 在 StudId 上 建立 了 索引 ， 每 条 索引 包含 
一 个 值 和 一 个 rid， 值 出 现在 表 中 某 些 行 的 StudId 列 上 ，rid 是 数据 文件 中 页 的 ID。 所 以 在 索引 
中 有 (425360777, (3, 1)) 这 个 项 。 

这 种 集成 节约 了 存储 空间 ， 因 为 不 需要 指针 ， 而 且 查 找 键 既 不 必 存 储 在 素 引 项 中 ， 也 不 
必 存 储 在 包含 相应 行 的 数据 记录 中 。 

SQL-92 标 准 没 有 提供 这 种 索引 的 建立 和 删除 操作 。 但 索引 是 数据 库 系统 必需 的 部 分 ， 大 
多 数 供应 厂商 都 会 提供 索引 。 在 某 些 情形 之 下 ， 带 有 查找 键 的 索引 是 和 主键 等 价 的 ， 在 表 被 
创建 时 自动 产生 。 这 种 索引 通常 是 集成 的 存储 结构 ， 能 在 添加 或 修改 行 时 有 效 地 保证 主键 的 
唯一 性 (能 支持 涉及 主键 的 高 效 查询 )。 


日 ”有些 索 引 只 存储 了 页 的 ID， 因 为 访问 数据 文件 的 主要 开销 是 传输 页 的 开销 ， 在 索引 项 中 只 存储 页 的 ID， 使 
得 准确 定位 页 成 为 可 能 。 一 且 检 索 到 页 ， 使 用 顺序 查找 就 能 定位 页 上 有 目标 查找 值 的 记录 ， 和 传输 页 的 时 
间 相 比 ， 通 常用 于 查找 的 附加 计算 时 间 是 很 少 的 ， 其 合理 性 能 在 索引 项 上 所 节省 的 空间 中 得 以 证 明 。 索 引 
项 更 少 的 索引 能 装 人 更 小 的 页 面 中 ， 因 而 访问 时 只 需 更 少 的 页 WO 开销 。 在 有 些 索引 组 织 中 ， 仅 一 个 索引 项 
就 包含 多 个 指针 。 由 于 这 一 特征 没有 增加 新 的 概念 ， 只 会 使 我 们 的 讨论 复杂 化 ， 在 此 我 们 不 进 -- 步 考虑 。 
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索引 文件 





索引 项 的 定位 机 制 


数据 文件 
图 11-7 指向 一 个 单独 的 数据 文件 的 索引 

除 自动 创建 的 索引 之 外 ， 数 据 库 系 统一 般 还 提供 一 个 语句 〈 用 它们 的 专用 语言 ) 来 创建 
索引 。 例 如 : 

CREATE INDEX TRANSGRD ON TRANSCRIPT (Grade) 
这 个 语句 将 Grade 作为 查找 键 在 表 TRANSCRIPT 上 建立 称 作 TRANSGRD 的 索引 。 如 果 CREATE 
INDEX 没 有 提供 一 种 选择 来 指定 索引 的 类 型 ， 那 么 通常 使 用 B* 树 索引 。 在 任何 情况 下 ， 创 建 
的 索引 被 保存 在 一 个 索引 文件 中 ， 如 图 11-7 所 示 。 它 引用 一 个 表 ， 这 个 表 已 与 存储 结构 中 的 
另 一 个 索引 集成 在 一 起 。 数 据 文件 可 以 按 某 种 存储 结构 来 组 织 ， 它 涉及 一 种 定位 机 制 ， 如 图 
11-6 所 示 。 但 为 简单 起 见 ， 在 此 我 们 不 考虑 这 个 问题 。 

使 用 一 个 合适 的 索引 ， 能 大 大 地 减少 查找 时 所 要 访问 的 数据 文件 中 的 页 ， 但 访问 索引 本 
身 也 是 一 种 开销 。 如 果 索 引 很 小 ， 可 以 装 和 人 主 存 ， 那 么 这 种 开销 是 很 小 的 。 但 如 果 索 引 很 大 ， 
则 必须 从 大 容量 的 存储 设备 中 检索 索引 页 ， 这 些 1/O 操 作 也 必须 视 为 查找 净 开 销 的 一 部 分 。 

因为 要 对 索引 进行 维护 ， 所 以 必须 有 选择 地 添加 索引 。 如 果 索 引 表 是 动态 的 ， 那 么 索引 
本 身 也 必须 随 关 系 的 变化 而 作 相 应 的 修改 。 例 如 ， 新 插入 一 行 到 关系 中 ， 就 要 求 在 索引 表 中 
插入 一 条 新 的 索引 。 所 以 ， 除 在 查找 过 程 中 访问 索引 表 的 开销 外 ， 索 引 作 为 数据 库 操作 的 一 
部 分 ， 也 必须 作 相应 的 修改 。 由 于 这 方面 的 开销 ， 删 除 一 条 不 能 充分 支持 数据 库 查询 的 索引 
是 可 取 的 。 因 此 ， 一 个 在 CREATE INDEX 中 命名 的 索引 名 可 以 被 DROP INDEX 引 用 ， 这 样 可 
以 删除 一 条 索引 。 

在 讨论 特殊 的 索引 结构 之 前 ， 我 们 先 介绍 几 个 常见 的 用 来 分 类 索引 的 属性 。 


11.4.1 RERI SAMAR] 


在 又 装 索 引 中 ， 物 理 位 置 上 相近 的 索引 项 在 一 定 程度 上 预示 相应 数据 记录 也 很 相近 。 和 
非 聚 焦 索 引 相 比 ， 这 样 的 索引 使 得 某 些 特定 的 查询 能 更 加 有 效 地 执行 。 查 询 优化 器 能 利用 索 
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| AD BR Fe OE ic ad A TT A RR (EELEE 14 He Pe a Te fl ERR E 
AD). RRMA RACK, KRRAPRS GRAPH (SUfEISAMALB HHH ) 还 是 无 序 
的 〈 在 散 列 索 引 中 )。 如 果 在 相同 的 查找 键 上 ， 索 引 项 和 数据 记录 都 是 有 序 的， 那么 就 称 有 序 
索引 是 聚 艇 的 (clustered), GMRRZAIERRA (unclustered), RBA RIK I RE 
11.6.1 节 加 以 定义 。 这 些 定义 表明 ， 如 果 组 织 索引 使 索引 项 与 数据 记录 集成 在 一 起 ， 那 它 一 定 
是 聚 答 的 。 图 11-7 的 索引 就 是 育 灸 索引 ， 这 里 的 索引 和 表 存 储 在 单独 的 文件 中 〈 因 而 数据 记 
“ 录 不 包含 在 索引 项 中 )。 在 数据 文件 中 ， 指 针 通常 由 索引 项 指向 记录 ， 这 表明 索引 项 和 数据 记 
录 在 同一 列 上 排序 。 图 11-8 所 示 的 索引 是 非 聚 得 的 。 
索引 文件 


， | oe |B CL 





TEEL 





数据 记录 





数据 文件 


图 11-8 数据 文件 上 的 非 聚 後 索引 


RRR S| AREER] (main index ) ， 非 聚 秘 索引 通常 称 作 是 辅助 索引 (secondary 
index) 。 。 最 多 只 有 一 个 聚 簇 索引 (因为 数据 文件 最 多 只 能 在 一 个 查找 键 上 排序 ) ， 但 可 以 有 
多 个 辅助 索引 。 由 语句 CREATE TABLE 创 建 的 索引 通常 是 聚焦 索引 。 对 某 些 数据 库 系 统 ， 聚 
镰 索 引 总 是 与 数据 文件 集成 为 一 种 存储 结构 。 在 这 种 情况 下 ， 索 引 项 包含 数据 记录 ， 如 图 11-6 
所 示 。 由 语句 CREATE INDEX 所 创建 的 索引 通常 是 辅助 索引 ， 非 认得 索引 存储 在 一 个 单独 的 
索引 文件 中 (尽管 有 些 数据 库 系 统 人 允许 程序 员 请 求 创建 一 个 聚焦 索引 ， 但 这 涉及 存储 结构 的 
重组 )。 主 索引 上 的 查找 键 可 能 是 表 上 的 主键 ， 但 并 不 一 定 。 

如 果 某 列 是 查找 键 ， 同 时 又 是 辅助 索引 ， 那 我 们 就 说 这 个 文件 在 这 列 上 是 反 序 的 
(inverted)。 如 果 不 被 主键 包含 的 所 有 列 组 成 一 个 辅助 索引 ， 那 么 我 们 就 说 这 个 文件 厦 完 全 反 
序 的 (fully inverted). k 


O RERIAHLRAERS. RNB RE, LAHESEXRLER I SERNA AHE 
发 生 混 并。 主 索引 并 不 一 定 是 关系 中 主键 上 的 索引 ， 如 关系 PRoFESSoR 能 按 Department 属 性 (甚至 不 是 键 ) 
排序 ， 建 立 聚 簇 索 引 ， 而 关系 中 ID 属 性 (同时 也 是 主键 ) 上 的 索引 是 非 聚 徐 的 ， 因 为 行 并 不 在 此 属性 上 
AF. Ea 
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一 个 包含 查找 键 的 聚 侯 索引 sk 对 涉及 sk 的 范围 查找 是 非常 有 效 的 。 当 索引 项 的 查找 键 值 
是 查找 范围 的 一 个 边界 值 时 ， 它 的 定位 机 制 能 有 效 地 进行 定位 ， 因 为 索引 项 在 sk 上 是 有 序 的 ， 
在 这 一 范围 内 ， 后 续 的 各 项 处 在 同一 个 索引 页 中 (或 处 在 连续 的 页 中 ， 我 们 将 在 11.5 节 讨论 
这 种 情形 ) ， 使 用 这 些 索引 项 就 能 检索 数据 记录 。 

聚 饶 索 引 的 优点 在 于 ， 数 据 记 录 本 身 是 组 织 在 一 起 的 (而 不 是 分 散在 整个 数据 文件 ) 。 它 
们 或 者 包含 在 索引 项 中 ， 或 者 按 索引 排序 ( 见 图 11-7)。 所 以 在 某 个 范围 内 检索 特定 的 数据 记 
录 时 ， 高 速 缓存 命中 率 是 很 高 的 ， 因 为 处 在 这 一 页 的 其 他 记录 可 能 已 经 被 访问 过 。 如 11.3 节 
所 述 ， 在 数据 文件 上 所 做 的 MO 操作 数 大 约 是 R/B ， 其 中 R 是 在 这 一 范围 内 的 元 组 数 ，B 是 一 页 
中 的 元 组 数 。 

使 用 一 个 与 数据 分 开 存储 的 聚 簇 索引， 在 有 效 地 处 理 范 围 搜 索 时 ， 数 据 文件 就 不 必 完 全 
有 序 。 例 如 ， 溢 出 页 可 用 来 存放 动态 插入 的 记录 ， 每 当 插入 一 行 时 ， 就 构造 一 条 新 的 索引 并 
将 它 放 在 索引 文件 的 适当 位 置 。 由 于 在 一 个 索引 页 (或 几 个 索引 页 ) 上 索引 是 有 序 的 ， 所 以 
索引 的 定位 机 制 能 有 效 地 找到 所 有 的 索引 。 即 使 在 数据 文件 排序 后 ， 扫 描 添加 的 行 性 能 会 有 
所 下 降 ， 但 检索 数据 页 的 高 速 缓存 命中 率 还 是 很 高 。 

尽管 数据 文件 不 必 完 全 有 序 ， 但 索引 项 不 能 简单 地 添加 到 索引 文件 中 ， 它 们 必须 与 索引 
的 定位 机 制 集成 在 一 起 。 所 以 ， 看 起 来 我 们 把 使 数据 文件 有 序 的 难题 转换 成 使 索引 文件 正确 
组 织 的 问题 。 但 后 面 的 这 个 问题 并 不 像 看 起 来 那样 困难 。 一 方面 ， 索 引 项 比 数据 记录 数 少 得 
多 ， 所 以 索引 文件 远 比 数据 文件 小 。 因 此 ， 索 引 的 重组 只 需 较 少 的 1O。 而 且 ， 我 们 将 要 看 到 ， 
一 个 与 B' 树 索引 相关 的 算法 能 用 来 有 效 地 处 理 索 引 的 添加 和 删除 。 

如 果 在 sk 上 有 一 个 非 聚焦 素 引 ， 那 么 在 某 一 范围 内 包含 查找 键 值 的 索引 项 是 可 以 定位 的 ， 
因为 索引 项 是 组 织 在 一 起 的 。 与 非 聚焦 索引 相关 的 问题 是 ， 相 应 的 记录 可 能 分 散在 整个 数据 
文件 由 。 因 此 ， 如 果 在 某 一 范围 内 有 R 条 索引 ， 为 检索 数据 记录 ， 可 能 有 必要 进行 R 次 MO 操作 
(在 后 面 的 小 节 中 ， 我 们 将 讨论 对 这 一 数据 进行 优化 的 技术 )。 

例如 ， 一 个 数据 文件 可 能 包含 10 000 页 ， 但 对 一 个 特定 的 查询 来 说 ， 可 能 只 有 100 条 记录 
落 在 这 一 范围 内 。 如 果 这 个 查询 的 WHERE 子 名 的 属性 上 有 一 个 非 聚 簇 索引 是 可 用 的 ， 那 公 检 
索 这 个 数据 文件 的 页 最 多 只 需要 100 次 IO 操作 (如 果 数 据 存储 在 一 个 没有 索引 的 堆 文件 中 ， 
那么 可 能 需要 10 000 次 IO 操作 )。 如 果 索 引 是 聚 灸 的 ， 每 个 数据 文件 的 页 平均 包含 20 条 数据 记 
录 ， 那 么 大 约 需 要 检索 5 个 数据 页 ， 在 比较 的 过 程 中 , 我 们 忽略 索引 文件 上 的 MO 的 操作 。 对 
不 同 的 索引 结构 ， 我 们 分 别 讨论 索引 的 MO 操作 。 


11.4.2 稀疏 索引 和 稠密 索引 


我 们 已 经 假设 索引 是 稠密 的 。 稠 密 索 引 (dense index) 是 指 索引 中 的 项 与 数据 文件 中 的 
每 一 条 记录 一 一 对 应 。 非 聚 秘 索 引 一 定 是 稠密 的 ， 而 聚 秘 索 引 却 不 一 定 是 稠密 的 。 一 个 有 序 
文件 上 的 稀 朴 索引 是 指 对 数据 文件 中 的 每 一 页 ， 都 有 一 个 索引 项 ， 反 之 亦 然 。 每 条 索引 包含 
一 个 小 于 或 等 于 它 指 向 页 的 所 有 记录 的 值 。 稀 疏 索 引 和 稠密 索引 的 区 别 可 以 用 图 11-9 中 的 表 
PROFESSOR 来 说 明 。 为 对 图 进行 简化 ， 我 们 没有 显示 出 数据 文件 中 的 溢出 页 ， 并 假设 所 有 的 存 
储 权 都 被 填 满 。 数 据 文件 用 两 种 不 同 的 索引 文件 进行 索引 ， 在 索引 文件 中 只 显示 了 索引 项 ， 
不 包括 定位 机 制 。 而 且 我 们 假设 每 页 有 4 个 存储 槽 。 在 这 个 表 上 ， 属 性 ID 是 主键 ， 同 时 也 是 表 
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示 在 图 左边 稀疏 索引 的 查找 键 ， 属 性 Name 是 表示 在 图 右边 的 稠密 索引 的 查找 键 。 






es 


EE in 


图 11-9 有 查找 键 Id 的 稀疏 索引 (左边 )， 查 找 键 为 Name 的 稠密 索引 (右边 )， 
它们 都 指向 表 PRorEssOR， 该 表 存 储 在 一 个 文件 中 ， 并 按 了 排序 


为 检索 Id 为 333444555 的 记录 ， 我 们 可 以 惩 用 稀疏 索引 来 定位 小 于 目标 Id 但 值 最 大 的 索引 
项 。 在 这 里 ， 符 合 上 述 条 件 的 索引 项 的 值 为 234567891， 它 指向 数据 文件 的 第 二 页 。 一 量 检 索 
到 这 一 页 ， 可 通过 向 前 搜索 该 页 来 找到 目标 记录 。 使 用 稀疏 索引 时 ”数据 文件 按 作为 索引 的 
关键 字 排 序 是 很 重要 的 。 因 为 有 序 文 件 允 许 我 们 定位 不 被 索引 引用 的 记录 ， 因 此 稀疏 索引 必 
Bi SEE 

dk EO AE, WHR MARELLA EAA o 因为 如 果 数据 文件 中 ， 
对 相同 的 查找 键 值 ， 存 在 多 个 记录 分 散在 不 同 的 页 ， 
那么 第 一 页 中 的 记录 就 有 可 能 被 错过 ， 该 问题 如 图 
11-10 所 示 。 称 下 索 引 的 查找 键 值 是 表 的 第 一 列 ， 它 
不 是 候选 键 。 通 过 寻找 查找 键 值 为 20 的 记录 的 索引 ， 
指针 指向 一 个 查找 键 值 为 20 的 索引 , 向 前 搜索 目标 页 ， 
得 到 查找 键 值 为 20 的 一 条 记录 ， 而 错过 数据 文件 的 前 
一 页 中 含有 同样 查找 键 值 的 记录 。 

可 以 应 用 多 种 技术 来 处 理 这 类 问题 。 最 简单 的 广 
法 是 : 当 目标 值 和 稀疏 索引 值 相等 时 。 搜 索 数据 文件 
前 一 页 。 另 一 个 办 法 是 为 表 中 每 个 不 同 的 键 值 创建 一 
个 索引 项 (不同 于 每 页 对 应 一 条 索引 )。 这样， 就 可 
能 有 多 条 索引 指向 同一 页 ， 即 使 表 中 的 行 有 很 多 重复 ALO MARINA: 

的 查找 键 值 ， 这 类 索引 也 比 一 个 稠密 索引 要 小 得 多 ， ip cir 

IRR LER, BLL-O RF ARORA RS). KAERRA KUR, 

查找 键 不 必 是 表 上 的 候选 键 。 因 此 ， 多 个 索引 项 可 以 有 相同 的 查找 键 值 (如 图 所 示 )。 


11.4.3 包含 多 个 属性 的 查找 键 
查找 键 可 能 包含 多 个 属性 。 例 如 ， 可 以 通过 执行 下 列 语句 
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CREATE INDEX NAMEDEPT ON PROFESSOR (Name, DeptId) 
在 PROFESSOR 上 创建 索引 。 当 支持 的 应 用 客户 经 常 请 求 通过 姓名 和 系 别 Id 来 查询 教授 的 有 关 信 
息 时 ， 这 样 的 索引 是 很 有 用 的 。 利 用 这 样 的 索引 ， 系 统 能 直接 检索 出 所 需要 的 记录 。 不 仅 不 
必 扫 描 整 个 表 ， 而 且 不 必 检索 有 相同 姓名 而 在 不 同系 的 教授 的 记录 (在 某 二 个 系 ， 不 可 能 出 
现 两 名 教授 有 相同 的 名 字 的 情况 )。 

这 条 语句 产生 的 稠密 非 聚 秘 素 引 如 图 11-11 所 示 的 结论 ， 索引 项 是 按 Name 和 DeptId 排 序 
的 〈 注 意 ， 在 图 11-9 所 示 的 稠密 索引 中 ，Mary Brown 的 两 条 索引 与 它们 所 在 的 位 置 顺序 现在 
颠倒 了 ) 。 
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PROFESSOR 
图 11-11 ZePRoFEssor EERE Name, Deptlay pizz] 


在 查找 键 中 使 用 多 个 属性 的 第 一 个 优点 在 于 ， 结 果 索 引 支持 更 细 粒 度 的 查询 .利用 
NAMEDEPT 我 们 可 以 迅速 检索 出 经 济 系 中 名 为 Mary Biown 教 授 的 信息 ， 曾 1T-9 所 示 的 稠密 索引 
要 求 我 们 检查 两 条 数据 记录 。 

第 二 个 优点 在 于 ， 如 果 索 引 项 是 有 序 的 《针对 ISAM 和 B: 竺 索引) CRE ZERAN 
范围 搜索 。 例 如 ,我 们 可 以 检索 出 某 个 系 所 有 名 为 Mary Bfown 的 教授 的 记录 《外 等 信 搜 索 )， 
而 且 我 们 可 检索 出 所 有 名 为 Mary Brown 的 教授 ， 其 所 在 系 名 搂 字母 顺序 处 于 经 济 系 和 社会 学 
系 之 间 的 记录 信息 ， 或 者 可 检索 出 所 有 系 中 名 为 Mary Biown 的 教授 的 记录 信息; 还 可 检索 出 
所 有 系 中 名 字 按 字母 顺序 处 在 Mary Brown 和 David Jones 之 间 的 教授 的 记录 信息 。 以 上 所 有 的 
这 些 例子 都 是 范围 查询 ， 因 为 索引 项 首先 是 按 Name 排 序 ， 其 次 是 接 De 襄 a 排 序 避 所 风 这 至 查 
询 都 被 支持 。 因 此 ， 目 标 索引 项 在 索引 文件 中 是 逻辑 旺 连 续 交 二 我 们 能 限制 扫描 的 范围 ， 后 
面 的 两 个 例子 是 部 分 键 查找 (partial key seareh)， 即 查找 键 中 二 此 属 粹 的 什 没 有 被 指定 。 

入 意 ，NAMEDEPT 不 支持 范围 查找 ， 其 中 没有 给 出 姓名 的 秆 (例如 检索 出 所 有 经 济 系 的 
教授 )。 因 为 在 这 种 情况 下 ， 目 标 索 引 项 在 索引 文件 中 不 是 连续 的 ， 这 应 是 查找 和 区别 于 优选 
键 的 原因 。 在 查找 键 中 ， 属 性 的 顺序 是 非常 重要 的 ， 而 对 芯 选 链 却 永 是 淡 样 。 使 用 部 分 键 害 
找 ， 查 找 键 的 前 毕 值 可 用 于 索引 的 查找 ， 但 索引 却 泵 支持 多 种 的 后 织 者 找 ; 

例如 ， 在 设计 5.7 节 给 出 的 学 生 注册 系统 时 ， TRANSCRIPT 表 的 主键 是 StudId、CtsCode、 
SectionNo、Semester 和 Year。 可 以 在 Student Grade 交 互 上 使 用 一 个 索引 ， 它 的 查找 键 由 给 定 
看 序 的 上 述 属性 组 成 ， 因 为 在 给 出 一 名 学 生成 绩 时 ， 必 须 提供 所 有 这 些 信息 。 但 Class Roster 
交互 不 能 使 用 这 一 索引 ， 因为 查找 指定 的 是 CrsCode、SectionNo、 Semester、Year， 而 不 是 
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StudId。 由 于 有 Studld， 所 以 索引 对 查找 学 生 的 历史 成 绩 是 有 帮助 的 ， 但 这 不 是 最 优 的 ， 因 为 
在 交互 过 程 中 使 用 一 个 SELECT 语句 ， 其 中 的 WHERE 子 句 指定 StudId 和 Semester/Year， 遗 憾 
的 是 ， 没 有 CrsCode 和 SectionNo ， 索 引 不 支持 使 用 Semester/Year。 在 主键 中 ， 将 这 些 属 性 的 
顺序 颠倒 ， 就 能 支持 Student Grade 和 Grade History 的 查询 ，Student Roster 的 交互 还 需要 另 一 
个 索引 。 

一 般 地 ， 表 R 上 查找 键 为 K 的 一 个 树 索引 支持 下 列 形式 的 查找 : 


O ain op val, A.A attr, Opn val, (R) ( 11.4 ) 


但 其 前 提 条 件 是 天 的 一 些 前 缀 是 查找 键 中 命名 的 属性 的 一 个 子 集 。 例 如 ， 如 果 (11.4) 的 
属性 是 有 序 的 ，attr1，…，attr;,，s <n， 是 K 的 一 个 前 级 ， 那 么 对 某 个 s<n， 搜 索 定 位 满足 
attr;=val, A+ 人 attr, = val 的 最 小 索引 项 ， 并 从 满足 (11.4) 的 项 处 开始 向 前 扫描 。 因 此 ， 一 
个 特定 的 索引 可 以 按 不 同 的 方式 支持 多 种 形式 的 查找 ， 可 以 按 多 个 访问 路 径 来 访问 了 R。 

最 后 ， 含 多 个 属性 的 查找 键 表明 : 一 个 索引 可 包含 索引 表 中 任意 的 信息 。 一 个 含有 多 个 
属性 的 稠密 索引 ， 其 每 一 项 对 应 表 中 的 一 行 ， 它 可 以 包含 表 中 任意 多 个 列 的 信息 。 这 意味 着 ， 
对 一 些 查询 ， 不 需 访 问 表 就 可 从 索引 中 找到 所 请 求 的 信息 。 例 如 ， 执 行 下 列 查询 


SELECT P.Name 
FROM PROFESSOR P 
WHERE P.DeptId = 'EE' 


结果 可 从 索引 NAMEDEPT 中 得 到 ， 而 不 必 通 过 扫描 索引 项 访问 PRoFEsSoR。 由 于 存储 索引 的 页 
比 表 页 要 少 ， 所 以 扫描 索引 的 开销 比 扫描 表 PRorEssoR 的 开销 要 小 。 


11.5 多 级 索引 


在 前 面 的 章节 中 ， 我 们 对 索引 项 进行 了 讨论 ， 而 没有 讨论 用 定位 机 制 查找 索引 。 在 这 一 
部 分 ， 我 们 来 讨论 树 索引 中 使 用 的 定位 机 制 ， 然 后 描述 索引 顺序 存 取 方 法 (ISAM) 和 B* 树 中 
特殊 的 定位 机 制 。 

为 理解 树 索 引 中 的 定位 机 制 的 工作 原理 ， 考 虑 图 11-9 所 示 表 PROFESSOR 上 的 稠密 索引 。 因 
为 查找 键 是 Name， 所 以 索引 项 在 这 个 字段 上 是 有 序 的 ， 因 为 数据 文件 中 数据 记录 的 顺序 是 不 
同 的 ， 所 以 索引 是 非 聚 签 的 。 我 们 假设 索引 项 顺序 存储 在 索引 文件 的 页 中 。 对 这 些 索引 而 言 ， 
一 个 朴素 的 定位 机 制 是 二 分 查找 法 。 因 此 ， 为 定位 描述 Sanjay Sen 的 记录 ， 我 们 先 找到 索引 
项 列 的 中 点 ， 比 较 Sanjay Sen 和 这 页 查找 键 的 值 。 如 果 目 标 值 能 在 这 页 找到 ， 就 定位 索引 
项 ; 如 果 小 于 (或 大 于 ) 这 页 上 查找 键 的 值 ， 这 个 过 程 就 在 索引 表 的 前 一 半 (或 后 一 半 ) 上 
递归 地 重复 进行 。 一 旦 定位 到 索引 项 ， 就 将 含有 这 条 记录 的 数据 页 提取 出 来 ， 仅 有 一 次 额外 
的 VO 操作 。 

和 11.3 节 所 描述 的 将 二 分 查找 法 用 于 有 序 的 数据 文件 相 比 ， 把 二 分 查找 法 用 于 索引 文件 是 
一 个 很 大 的 改进 ， 因 为 数据 记录 通常 比索 引 项 要 多 得 多 。 所 以 ， 如 果 Q 是 包含 索引 项 的 稠密 树 
索引 的 页 面 数 ，F 是 数据 文件 的 页 面 数 ， 则 Q<<F。 使 用 二 分 查找 法 来 定位 一 条 索引 的 LO 操作 
数 是 不 可 能 大 于 log2Q 的 。 

通过 为 索引 项 列表 建立 索引 ， 我 们 可 以 进一步 减少 定位 索引 项 的 开销 。 使 用 相同 的 查找 
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t, RIERS EAE TARR (这 样 的 稀疏 索引 是 可 能 的 ， 因 为 索引 项 在 这 个 键 上 
有 序 )， 这 时 我 们 再 对 索引 使 用 二 分 查找 法 。 二 级 索引 上 的 索引 项 作为 分 类 符 ， 对 查找 一 级 索 
引 上 的 索引 项 起 引导 作用 。 因 此 ， 我 们 使 用 术语 叶子 项 (leaf entry) 来 指 处 于 索引 树 上 最 低 
一 级 上 的 索引 项 ， 使 用 分 类 符 项 (separator entry) 来 指 处 在 上 层 的 索引 项 。 

这 一 技术 如 图 11-12 所 示 ， 该 图 表示 一 个 二 级 索引 。 为 使 图 更 加 精确 ， 我 们 假设 表 上 的 一 
个 候选 键 是 整 型 的 ， 我 们 使 用 该 键 来 作 索 引 的 查找 键 ， 我 们 还 假设 索引 文件 上 的 一 页 可 以 容 
纳 4 条 索引 项 。 当 然 ， 在 实际 的 系统 中 ， 一 个 索引 页 可 以 容纳 更 多 条 索引 (比如 说 100 条 )， 和 和 
数据 文件 的 大 小 相 比 ， 索 引 的 大 小 是 很 小 的 。 






含有 分 类 符 项 
的 稀 朴 索引 






图 11-12 二 级 的 索引 


在 这 个 图 和 后 面 的 图 中 ， 我 们 显 式 地 显示 数据 记录 。 可 以 用 两 种 方式 来 解释 图 : 1) 索引 
(HF) 项 包含 一 个 指向 数据 文件 中 数据 记录 的 指针 ，2) 叶子 索引 包含 数据 记录 ， 图 代表 一 种 
存储 结构 。 在 解释 1 中 ， 索 引文 件 包含 叶子 索引 和 二 级 索引 ， 访 问 数据 记录 需要 一 次 额外 的 
IO 操作 ， 在 解释 2 中 ， 定 位 一 个 叶子 索引 需 提 取 相 应 的 数据 ， 不 需要 额外 的 MO 操作 ， 我 们 所 
讨论 的 多 级 索引 可 应 用 于 这 两 种 情形 。 

最 后 , 尽管 图 中 二 级 索引 的 分 类 符 看 起 来 是 和 叶子 索引 相等 的 , 但 事实 却 并 不 总 是 这 样 。 
在 解释 2 中 ， 只 有 叶子 索引 包含 数据 记录 ， 而 分 类 符 却 没有 包含 数据 记录 ， 因 而 相 比 较 而 言 ， 
叶子 索引 比分 类 符 大 。 在 解释 1 中 ， 分 类 符 和 叶子 索引 项 看 起 来 相等 ， 只 是 第 二 级 上 的 分 类 
” 符 指向 第 一 级 上 的 结 点 ， 而 叶子 索引 则 指向 数据 文件 中 实际 的 记录 。 这 些 指 针 的 格式 是 不 
使 用 二 级 索引 ， 我 们 把 叶子 的 二 分 查找 分 为 两 步 : 第 一 步 ， 对 最 上 面 一 级 的 稀疏 索引 使 
用 二 分 查找 法 ， 找 到 指向 包含 目标 叶子 索引 页 的 分 类 符 项 ; 第 二 步 ， 从 页 中 找到 相应 的 索引 
项 (如 果 存 在 的 话 )。 所 以 ， 如 果 我 们 要 找 查 找 键 的 键 值 为 33 的 项 时 ， 我 们 首先 使 用 二 分 查找 
法 来 定位 值 小 于 或 等 于 33 的 最 右边 的 分 类 符 ， 这 里 的 分 类 符 值 为 19。 然 后 我 们 顺 着 指针 找到 
叶子 索引 的 第 二 页 ， 在 这 一 页 上 作 线 性 搜索 找到 需要 的 索引 项 。 如 果 目 标 查 找 键 值 是 32， 我 
们 将 执行 相同 的 步骤， 然后 得 出 结论 : 在 候选 键 属性 上 ， 索 引 表 中 没有 值 为 32 的 一 行 。 

通过 引入 二 级 索引 ， 我 们 得 到 什么 ? 因为 上 面 级 别 的 索引 是 稀疏 的 ， 所 以 和 第 一 级 的 叶 
子 索 引 相 比 ， 分 类 符 是 较 少 的 。 如 果 我 们 假设 数据 和 索引 文件 是 分 开 的 ， 那 么 分 类 符 和 时 子 
索引 大 小 差不多 。 而 且 ， 我 们 假设 在 一 个 索引 页 上 包含 100 条 索引 ， 那 么 二 级 索引 就 包含 
Q/100 个 页 (这 里 的 Q 是 指 叶 子 页 的 数目 )， 那 么 使 用 二 分 查找 法 访问 二 级 索引 上 的 一 个 叶子 
索引 的 最 大 开销 大 约 是 logzx(Q/100)+1 个 页 的 IO 操作 (这 里 的 1 是 指 包 含 叶子 索引 的 那 页 ) ， 和 
对 叶子 索引 实施 二 分 查找 法 的 开销 log:Q 相 比 ， 如 果 Q 相 当 大 时 ， 这 能 避免 很 大 的 开销 。 
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这 促使 我 们 研究 多 级 索引 。 如 果 一 个 二 级 索引 是 可 取 的 ， 那 为 什么 不 使 用 多 级 索引 呢 ? 
每 一 级 索引 使 用 更 少 的 、 更 高 一 级 的 稀 玻 索引 来 进行 索引 ， 直 到 索引 能 被 包含 在 一 个 页 面 中 
为 止 。 搜 索 读 索引 的 IO 开销 是 1， 所 以 定位 目标 叶子 索引 的 总 开销 和 索引 的 级 数 是 相等 的 。 

一 个 多 级 索引 如 图 11-13 所 示 ， 每 个 长 方形 框 代表 一 页 。 树 的 最 低 一 级 包含 叶子 索引 ， 它 
被 称 作 是 叶子 级 (leaf level )。 如 果 我 们 将 所 有 页 按 顺 序 都 放 在 这 一 级 上 ， 那 么 叶子 索引 就 构 
成 一 个 有 序 的 列表 ， 上 层 包含 分 类 符 ， 被 称 为 分 类 符 级 (separator level) ; 如 果 我 们 在 某 一 
特定 的 分 类 符 级 上 按 顺 序 把 所 有 的 页 都 连接 起 来 ， 我 们 就 得 到 下 一 级 的 一 个 稀 醇 索 引 。 树 的 
根 ( 最 项 层 分 类 符 ) 是 一 个 稀疏 索引 ， 它 包含 在 索引 文件 的 一 个 页 面 中 。 如 果 叶 子 索引 包含 
数据 记录 ， 那 么 图 就 表示 一 个 树 索引 文件 的 存储 结构 。 






第 ;级 上 的 稀疏 索引 






. 索引 的 级 数 


叶子 级 
(索引 项 ) 





图 11-13 一 个 多 级 索引 的 图 示 


我 们 使 用 术语 索引 级 (index level) 来 指 索引 树 上 的 任意 一 级 ， 叶 子 或 者 是 分 类 符 。 使 用 
REMH (fan out) 来 指 一 页 中 分 类 符 的 数目 。 扇 出 数 可 以 控制 树 的 级 数 : HBR 
树 的 级 数 就 越 多 。 树 的 级 数 是 和 提取 一 个 叶子 索引 的 MO 操作 数 相 等 的 。 如 果 扇 出 数 用 中 来 表 
示 ， 提 取 一 个 叶子 索引 所 需 的 MO 操作 数 是 logeQ+1。 

例如 ， 如 果 在 叶子 级 上 有 10 000 页 ， 扁 出 数 是 100 (在 数据 文件 中 ， 假 设 有 105 行 ， 且 叶子 
索引 和 分 类 索引 的 大 小 是 相同 的 ) ， 那 么 检索 一 个 特定 叶子 索引 就 需要 对 3 个 页 进行 LO 操作 。 
因而 ， 使 用 大 的 扇 出 数 ， 即 使 对 很 大 的 数据 文件 ， 对 索引 的 遍历 都 会 减少 到 只 需要 很 少 的 UO 
操作 。 因 为 根 索引 只 占 一 个 页 面 ， 所 以 它 能 经 常 保存 在 主 存 中 ， 可 以 进一步 地 减少 开销 。 即 
使 是 二 级 索引 ， 在 这 里 也 只 需要 100 个 页 面 ， 实 际 上 也 是 可 以 放 在 主 存 中 的 。 

多 级 索引 构成 树 索引 的 基础 ， 我 们 下 面 要 讨论 树 索引 ， 说 明 为 什么 树 索引 被 经 常 使 用 ， 
不 仅 是 因为 它 提供 对 数据 文件 的 有 效 的 访问 方法 ， 正 如 我 们 将 会 看 到 的 ， 而 且 它 还 支持 范围 
查询 。 

11.5.1 索引 顺序 访问 
索引 顺序 访问 方法 (ISAM) 。 是 基于 多 级 索引 的 。ISAM 索 引 是 一 个 主 索引 。 因 此 它 是 


O 通常 在 使 用 时 ， 访 问 方法 (access method) 和 访问 路 径 (access path) 是 可 互 换 的 ， 但 我 们 更 偏向 于 使 用 
访问 路 径 ， 因 为 它 在 概念 上 更 加 一 致 。 
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记录 上 的 聚 秘 索引 ， 这 些 记录 是 按 索 引 的 查找 键 排序 的 。 一 般 来 说 ， 记 录 是 放 在 叶子 索引 中 
的 ，ISAM 是 数据 文件 的 一 个 存储 结构 。 

在 分 类 符 级 上 ， 一 个 页 的 格式 如 图 11-14 所 示 ， 每 一 个 分 类 级 是 它 下 一 级 的 稀疏 索引 。 每 
一 个 分 类 索引 由 一 个 查找 键 值 所 和 一 个 指向 索引 文件 其 他 页 的 指针 忆 组 成 。 这 一 页 可 能 在 下 一 
页 ， 或 处 在 下 一 分 类 符 级 上 ， 或 是 包含 叶子 素 引 中 的 页 。 分 类 索引 在 页 中 是 有 序 的 ， 我 们 假 
设 一 页 最 多 包含 中 条 分 类 索引 。 


索引 项 





图 11-14 一 个 ISAM 索 引 在 分 类 符 级 上 的 页 


每 一 个 查找 键 值 t 将 查找 键 值 集 分 成 两 棵 子 树 ， 分 别 用 两 个 相 邻 的 指针 pi;-, 和 p 指 向 这 两 棵 
子 树 。 如 果 一 个 查找 键 值 在 由 pi! 所 指向 的 子 树 中 ， 则 满足 kx<k&， 如 果 在 由 p; 所 指向 的 子 树 中 ， 
则 满足 :> k;。 这 就 是 为 什么 查找 键 值 在 索引 页 被 称 为 分 类 符 的 原因 。 和 一 个 多 级 索引 中 的 稀 
天 索引 页 相 比 ， 在 ISAM 索 引 页 中 ， 似 乎 还 包含 一 个 额外 的 指针 po 。 实 际 上 上， 比较 一 个 ISAM 
索引 页 和 分 类 索引 级 上 的 索引 页 时 ， 较 好 的 方法 是 分 类 符 包 含 一 个 额外 的 查找 键 值 : 最 小 的 
查找 键 值 在 页 ， 而 这 实际 上 是 不 必要 的 。 

图 11-15 是 一 个 ISAM 索 引 的 例子 。 其 中 ， 树 中 含有 两 级 分 类 符 和 一 个 叶子 级 索引 ， 查 找 
键 值 是 学 生 的 名 字 ， 名 字 是 按 字 母 顺序 编排 的 。 最 左边 子 树 上 (由 根 上 的 po 指向 ) 所 有 的 查 
找 键 值 都 小 于 judy， 中 间 子 树 ' 上 (aR EPR) 所 有 的 查找 键 值 都 大 于 或 等 于 judy。 在 创 
建 一 个 ISAM 文 件 时 ， 首 先 顺 序 分 配 存储 结构 中 的 页 作为 叶子 索引 页 (包含 数据 行 )， 然 后 自 
底 向 上 构建 分 类 符 级 : 根 是 最 上 面 一 级 的 索引 。 因 此 ，ISAM 索 引 有 这 样 的 属性 ， 所 有 出 现在 
分 类 索引 级 的 查找 键 值 ， 同 时 也 出 现在 叶子 索引 级 。 

查找 一 个 包含 查找 键 值 karen 的 数据 记录 是 从 根 开始 的 ,确定 目标 键 值 处 在 judy 和 rick 之 间 ， 
在 由 pi! 指向 的 下 一 级 索引 的 中 间 页 上 。 在 该 页 ， 确 定 karen 小 于 mike， 沿 着 po 所 指 ， 在 叶子 索 
引 页 上 找到 记录 所 在 的 位 置 。 如 果 要 检索 所 有 查找 键 值 在 karen 和 pete 之 间 的 数据 记录 ， 我 们 
首先 用 刚才 的 方法 找到 包含 karen 的 叶子 索引 ， 然 后 扫描 叶子 一 级 ， 直 到 遇 到 包含 pete 的 索引 
项 为 止 。 因 为 在 叶子 级 上 的 页 是 按 索 引 顺 序 有 序 存储 的 ， 所 以 要 找 的 项 在 文件 中 是 连续 的 。 
如 果 要 检索 查找 键 值 在 kate 和 paul 之 间 的 所 有 数据 记录 ， 我 们 将 扫描 相同 的 叶子 页 。 另 外 ， 
ISAM 索 引 还 支持 多 属性 键 和 部 分 属性 键 的 查找 。 

ISAM 索 引 以 如 下 事实 为 特征 : 分 类 符 级 一 旦 被 创建 就 不 再 改变 。 即 使 叶子 级 的 页 的 内 容 
可 能 改变 ， 页 本 身 不 会 被 释放 或 重新 分 配 。 因 此 ， 它 们 在 文件 中 的 位 置 是 固定 不 变 的 。 如果 表 
中 的 一 行 被 删除 ， 相 应 的 叶子 项 也 从 叶子 级 中 删除 ， 但 不 对 分 类 符 级 进行 修改 。 这 样 的 删除 就 
会 导致 一 个 查找 键 值 在 分 类 符 中 存在 ， 却 没有 相对 应 的 叶子 项 。 这 是 可 能 发 生 的 。 例 如 ， 如 果 


O 注意 ,现在 的 扁 出 是 @+1， 由 于 中 通常 要 比 1 大 得 多 ， 因 此 在 开销 计算 中 ,我们 忽略 中 与 @+1 的 差别 。 
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从 图 1-15 中 将 记录 jarie 删 除 ， 就 会 出 现 这 样 的 情况 。 这 样 的 索引 看 起 来 很 奇怪 ,但 它 却 仍然 能 
正确 的 工作 ， 也 不 会 产生 什么 严重 的 问题 (除了 浪费 叶子 项 原先 所 在 的 存储 空间 )。 





图 11-15 一 个 ISAM 索 引 的 例子 
当 添 加 一 条 记录 时 ， 会 出 现 很 严重 的 问题 ， 因 为 必须 创建 一 个 新 的 索引 项 ， 而 相应 的 叶 


子 页 却 可 能 已 经 满 。 通 过 使 用 一 个 小 于 1 的 装 
填 因 子 (对 一 个 ISAM 而 言 ， 装 填 因 子 为 0.75 
是 比较 合理 的 )， 可 以 避免 这 种 情况 的 发 生 ， 
但 最 终 可 能 还 是 需要 溢出 页 。 例 如 ， 插 入 关于 
ivan 的 一 行 (jane 行 已 经 删除 ) ， 结 果 索 引 最 左 
边 的 子 树 结果 如 图 11-16 所 示 。 注 意 ， 新 页 是 
一 个 溢出 的 叶子 一 级 的 页 ,不 是 一 级 新 的 索引 
或 者 一 个 新 的 叶 了 矛 级 的 页 。 如 果 一 个 表 是 动态 
的 ， 那 么 经 常 有 插入 操作 ， 谥 出 链 就 会 变 得 很 
长 。 结 果 ， 索 引 结构 就 变 得 越 来 越 低 效 ， 因 为 
要 满足 查询 要 求 ， 就 必须 搜索 溢出 链 。 链 上 的 
各 项 可 能 不 是 有 序 的 ， 溢 出 页 在 大 容量 存储 设 
备 上 可 能 并 不 在 物理 位 置 上 相 邻 。 为 消除 溢出 
fi, 索引 要 定期 重组 。 由 于 这 方面 的 原因 ， 尽 
管 TSAM 索 引 对 相对 静态 的 表 是 有 效 的 ,但 动 
态 表 不 常 使 用 ISAM 。 


11.5.2 B'#} 


- 
ps 





图 11-16 在 图 11-15 上 进行 一 次 插入 和 一 次 
删除 之 后 ISAM 索 引 的 一 部 分 


B 树 在 索引 结构 中 最 常用 。 实 际 上 ， 在 某 些 数据 库 系统 中 ， 它 是 唯一 可 用 的 。 和 ISAM 索 
引 一 样 ，B" 树 结构 是 基于 多 级 索引 的 ， 它 支持 等 值 查找 、 范 围 查找 和 部 分 键 查找 。 叶 子 索引 
可 包含 数据 记录 ， 在 这 种 情况 之 下 ，B* 树 不 仅 作为 索引 ， 而 且 还 可 以 作为 一 种 存储 结构 ， 用 
来 组 织 数 据 文件 中 的 记录 。 树 可 能 存储 在 一 个 索引 文件 中 ， 其 中 叶子 索引 包含 指向 数据 文 促 
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记录 的 指针 。 在 第 一 种 情形 中 ， 因 为 它 是 聚 簇 的 ， 所 以 B'* 树 是 一 种 类 似 于 ISAM 索 引 的 主 索 引 。 
在 第 二 种 情形 中 ， 它 可 能 是 一 种 主 索 引 或 辅助 索引 ， 数 据 文件 不 必 在 它 的 查找 键 上 排序 。 

图 11-17 是 一 个 B' 树 的 示意 图 ， 其 中 每 页 含有 一 个 有 序 的 索引 集 。 它 与 图 11-13 的 唯一 区 别 
是 添加 了 兄弟 指针 (sibling pointer), 兄弟 指针 把 叶子 级 上 的 页 连接 起 来 ， 这 样 的 链接 表 使 得 
记录 上 的 查找 键 值 是 索引 有 序 的 。 和 一 个 ISAM 相 反 ，B* 树 本 身 是 动态 改变 的 。 当 增加 和 删除 
记录 时 ， 索 引 页 和 页 子叶 会 做 相应 的 增加 、 删 除 或 修改 。 因 此 ， 叶 子 页 在 文件 中 可 能 不 是 连 
续 的 .但 链接 表 使 得 B" 树 支持 范围 查找 。 一 旦 使 用 等 值 查找 定位 范围 一 端的 叶子 索引 ， 范 围 
内 包含 查找 键 值 的 其 他 叶子 项 就 可 通过 扫描 列表 而 得 到 。 注 意 ， 在 这 种 模式 下 ，B+* 树 既 作 为 
主 索引 又 作为 辅助 索引 (这 种 情况 之 下 ， 数 据 记 录 不 必 按 查找 键 排序 )。 通 过 增加 兄弟 指针 ， 
图 11-15 变 成 一 棵 B* 树 ( 记 住 ， 叶 子 级 的 页 可 包含 也 可 不 包含 数据 记录 ) ©. 







在 级 别 i 上 的 


索引 级 别 


ea ares TT 
(索引 项 ) 


图 11-17 B- 树 的 示意 图 


在 ISAM 索 引 中 ,兄弟 指针 是 不 必要 的 。 因 为 在 文件 创建 时 ， 存 储 在 文件 中 的 叶子 索引 页 
(通常 包含 数据 记录 ) 是 有 序 的 ， 由 于 索引 是 静态 的 ， 所 以 顺序 保持 不 变 。 所 以 ， 一 个 范围 查 
找 可 以 通过 物理 扫描 文件 来 实现 。 动 态 插入 的 索引 项 不 是 按 索 引 顺 序 保存 的 ， 但 可 以 通过 溢 
出 链 来 定位 。 

B'* 树 与 ISAM 索 引 的 第 二 个 差异 在 于 ，B! 树 是 一 棵 平衡 树 (balanced tree). 这 意味 着 ， 即 
使 在 插入 新 的 记录 和 删除 旧 的 记录 之 后 ， 任 何 从 根 到 叶子 索引 的 路 径 都 具有 相同 的 长 度 。 因 
此 , 检索 一 个 特定 叶子 索引 的 VO 开销 和 检索 所 有 其 他 叶子 的 1/O0 开 销 是 相同 的 。 我 们 已 经 知道 ， 
使 用 具有 适当 扇 出 数 的 多 级 索引 可 显著 减少 开销 。® 是 一 个 索引 页 中 所 能 容纳 的 最 大 分 类 索 
引 数 。 如 果 我 们 假设 插入 和 删除 项 的 算法 (后面 将 简短 地 描述 六 保证 三 页 中 的 分 类 符 数 至 少 
是 /2 ( 即 最 小 扇 出 数 是 @/2) 。， 那 么 在 一 棵 有 Q 个 叶子 页 的 B* 树 上 的 次 找 开 销 最 多 是 
logwnQ+1 (一 般 来 说 ， 根 节点 上 的 分 类 索引 数 可 以 小 于 ®B/2， 这 个 因素 对 公式 有 一 点 影响 )， 
这 是 和 有 溢出 链 的 ISAM 索 引 不 同 的。 因为 链 的 长 度 是 无 限 的 ， 所 以 链 末 端 叶子 索引 查找 的 开 


昌 ”B 树 与 B' 树 的 差别 在 于 ， B 树 上 的 每 一 层 都 有 一 个 指针 指向 实际 数据 文件 的 一 条 记录 ， 即 每 个 索引 页 都 有 一 
个 分 类 符 和 叶子 索引 ， 这 表明 ， 一 个 特定 的 查找 键 值 在 树 上 只 出 现 一 次 ， 而 B* 树 却 没 有 这 样 的 属性 。 
日 ”对 于 中 为 奇数 的 情形 ， 最 小 的 分 类 符 数 应 为 [B121， 即 大 于 @/2 的 最 小 整数 。 
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销 也 是 无 限 的 。 

因此 ， 和 ISAM 索 引 相 比 ，B* 树 的 一 个 主要 优点 在 于 它 能 适应 表 的 动态 改变 。 当 添加 一 个 
新 记录 时 ， 不 是 创建 一 条 溢出 链 ， 而 是 修改 索引 结构 使 树 保持 平衡 。 当 结构 发 生 改变 时 ， 从 
页 中 添加 和 删除 索引 项 ， 使 一 页 中 的 分 类 索引 数 始 终 保持 在 /2 和 中 之 间 。 

让 我 们 来 看 一 下 在 图 11-15 的 索引 中 进行 一 系列 的 插入 操作 时 B'* 树 是 如 何 工作 的 。 这 种 情 
况 下 ，P=2。 图 11-18 显 示 在 插入 vince 记 录 之 后 的 最 右边 的 子 树 。 因 为 按 查 找 键 的 顺序 ，vince 
是 在 tom 之 后 ， 在 最 右边 的 叶子 页 上 有 空 的 叶子 索引 ， 所 以 不 需 对 B! 树 的 结构 做 修改 。 





图 11-18 在 图 11-15 中 插入 vince 后 的 部 分 索引 


假设 下 一 个 要 插入 的 是 vera， 它 在 tom 之 后 。 因 为 最 右边 的 叶子 页 已 满 ， 这 时 需要 一 个 新 
页 ， 但 不 是 使 用 一 个 溢出 页 ( 像 ISAM 索 引 那样 )， 我 们 创建 一 个 新 的 叶子 页 。 这 要 求 对 索引 
的 结构 进行 修改 。 这 就 是 B* 树 区 别 于 ISAM 的 地 方 。 因 为 必须 保持 查找 键 的 值 在 叶子 一 级 有 序 ， 
所 以 vera 必 须 插入 在 tom 和 vince 之 间 。 因 此 简单 地 创建 一 个 包含 vera 的 新 叶子 页 放 在 最 右边 是 
不 够 的 。 相反， 我 们 必须 分 配 一 个 新 的 叶子 页 ， 将 有 序 的 查找 键 分 成 大 至 相等 的 两 部 分 ， 一 
半 放 在 已 存在 的 叶子 页 中 ， 另 一 半 放 在 新 的 叶子 页 中 ,结果 如 图 11-19 所 示 。 在 图 中 ， 新 叶子 
页 中 最 小 的 一 项 vince 标 为 C。 因 此 , vince 在 索引 页 D 中 变 成 一 个 新 的 分 类 符 (叶子 页 B 中 所 有 
的 索引 项 都 小 于 vince), 现在 可 以 有 足够 的 空间 来 容纳 那 项 索引 。 一 般 来 说 ， 当 一 个 ( 满 的 ) 
叶子 页 包含 中 项 索引 时 ， 为 容纳 新 插入 的 项 ， 就 把 它 分 为 两 个 叶子 页 ， 其 中 一 页 包含 四 /2+1 条 
索引 ， 另 一 页 包含 /2 条 索引 ， 并 在 它 的 上 一 级 索引 上 插入 一 条 分 类 索引 , 我 们 把 这 个 规则 称 
为 规则 1。 注 意 ， 对 于 vince ， 有 一 条 分 类 符 和 一 条 叶子 索引 。 

如 果 再 插入 一 条 rob， 问 题 就 更 加 严重 ， 新 的 叶子 索引 必须 处 在 rick 和 sol 之 间 ， 这 就 要 求 
对 页 面 A 进 行 分 裂 ， 在 页 D 上 需要 4 个 指针 (指向 新 分 裂 的 两 个 页 和 B、C)。 但 一 个 页 面 只 能 
有 三 个 指针 ， 因 而 我 们 还 必须 对 D 进 行 分 裂 。 并 且 ， 按 照 规则 1， 我 们 必须 为 sol 创 建 一 条 分 类 
符 。 在 一 般 情况 下 ， 当 一 个 索引 页 要 存储 @+1 条 分 类 符 时 (在 这 里 是 sol、tom、vince ) ， 就 要 
分 裂 它 以 得 到 @+2 个 指针 指向 下 一 级 的 素 引 页 。 分 裂 后 的 每 一 个 页 分 别 含有 下 /2+1 指 针 和 @/2 
个 分 类 符 。 可 能 看 起 来 好 像 有 一 条 分 类 符 放 错位 置 ， 但 实际 上 并 不 是 这 样 。 

将 页 A 分 裂 成 A1 和 A2,D 分 裂 成 D1 和 D2 之 后 的 情形 如 图 11-20 所 示 。 注意 ， 页 D1 和 D2 中 
分 类 符 数 之 和 等 于 页 D 中 的 分 类 索引 数 ， 尽 管 值 可 能 不 同 ， 用 sol 代 替 了 tom。 这 个 数字 看 起 来 
很 奇怪 ， 因 为 叶子 级 上 分 隔 页 所 需 的 分 类 符 数 是 3 (sol、tom、vince)。 可 以 用 tom 来 解释 ， 它 
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将 D1 和 D2 中 的 值 分 开放 在 两 个 子 树 中 ， 自 身 变 成 更 高 一 层 上 的 分 类 符 。 一 般 地 ， 在 分 裂 一 个 
页 以 容纳 @+1 个 分 类 符 时 ， 中 间 的 那个 分 类 索引 不 是 存储 在 分 裂 后 的 两 个 页 面 里 ， 而 是 被 推 
到 树 的 上 一 层 ， 我 们 把 这 个 规则 称 为 规则 2。 





图 11-19 在 图 11-18 中 插入 vera 后 导致 一 个 叶子 页 的 分 裂 





图 11-20 图 11-19 的 索引 子 树 在 插入 rob 之 后 ， 导 致 一 个 叶子 页 和 一 个 索引 页 的 分 裂 


因此 ， 插 入 操作 并 没有 完成 。 分 类 索引 必须 向 上 推 , 在 更 高 一 层 的 索引 级 上 ， 对 索引 页 
D2 必须 指定 一 条 新 的 参照 索引 。 换 句 话 说 ， 这 个 过 程 必 须 继续 重复 ; 二 般 来 说 ， 这 个 过 程 要 
一 直 重 复 达 到 某 个 索引 级 ， 这 个 索引 级 能 够 容纳 一 条 新 的 分 类 索引 而 不 必 在 进行 分 裂 为 止 。 
在 我 们 的 例子 中 ， 下 一 个 索引 级 是 根 索 引 ， 因 为 它 不 能 容纳 二 条 新 的 分 类 索引 ， 也 必须 分 裂 ， 
这 里 的 分 类 索引 顺序 是 judy、rick 和 tom。 根 据 规 则 2，iiek 必 须 推 到 新 产生 的 籽 索 引 页 中 。 

这 时 ， 插 入 过 程 完成 ， 新 产生 的 B+ 树 如 图 11-21 所 示 。 注 意 ， 虽 然 层 数 增加 1， 但 树 仍然 
是 平衡 的 。 访 问 任何 一 个 叶子 索引 需要 4 次 IO 操作 ， 如 果 表 被 闫 每 地 访问 ， 那 么 证 根 索引 放 
在 主 布 中 ， 可 使 1O 操 作 次 数 减 1。 还 要 注意 ， 在 分 裂 A 时 ， 指 向 B 的 兄弟 指针 必须 更 新 ,这 要 
求 一 次 额外 的 MO 操作 ， 

节点 的 分 裂 使 得 开销 增加 ， 所 以 应 该 尽量 避免 节点 分 裂 。 一 种 办 法 就 是 在 创建 B+ 树 时 使 
用 一 个 小 于 1 的 装填 因子 (装填 因子 为 0.75 比 较 合适 ) 。 当然 ， 这 会 使 得 树 的 层 数 增 加 。 另 一 
种 插入 算法 是 试图 避免 分 裂 ， 这 涉及 叶子 级 上 索引 项 的 重新 分 布 .例如 在 图 11-9 中 我 们 插 
入 叶子 项 tony， 为 在 B 页 上 腾 出 空间 ， 需 要 把 vera 移 到 C 页 上 (在 D 页 上 把 分 类 符 项 vince 赫 换 
成 vera)， 重 新 分 布 通常 是 在 叶子 一 级 的 相 邻 页 上 完成 的 ， 这 些 叶 子 有 相同 的 父亲 。 这 样 的 二 
些 页 被 称 为 兄弟 (sibling). 
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以 上 的 讨论 解释 在 B* 树 上 插入 一 项 的 主要 过 程 。 练 习 11.12 要 求 用 实际 的 算法 来 说 明 这 一 
过 程 。 
删除 是 另 一 类 问题 。 当 页 变 得 稀疏 时 ， 树 会 变 得 越 来 越 深 ， 这 是 不 必要 的 。 因 为 这 不 仅 
增加 向 下 查找 的 代价 ， 而 且 增加 扫描 叶子 的 代价 。 为 避免 这 种 情况 ， 可 以 对 页 进行 压缩 处 理 ， 
要 求 每 一 页 至 少 包含 /2 个 索引 项 。 当 对 一 个 含有 /2 个 索引 项 的 页 进行 删除 操作 时 ， 先 对 它 
兄弟 页 上 的 索引 项 进行 重新 分 配 。 如 果 它 的 兄弟 页 上 也 只 有 @/2 个 索引 项 时 ， 重 新 分 配 是 不 可 
能 的 ， 这 时 就 把 它 与 某 一 个 兄弟 页 进行 合并 ,成 为 一 个 含有 -1 项 的 页 ， 然 后 将 一 条 索引 项 
从 树 的 更 高 一 层 上 删除 。 和 分 裂 能 将 树 向 上 推进 一 层 一 样 ， 合 并 的 结果 也 是 如 此 。 删 除 可 能 
导致 一 个 索引 页 上 的 索引 项 低 于 某 个 域 值 ， 这 要 求 对 分 类 符 进行 重新 分 配 或 者 对 页 进行 合并 。 
如 果 这 种 影响 传 到 根 节点 ， 根 上 的 最 后 一 个 分 类 索引 就 会 被 删除 ， 树 的 深度 就 减少 1。 练 习 
11.13 要 求 给 出 一 个 算法 对 这 一 过 程 进行 描述 。 

由 于 表 增 长 得 很 快 ， 所 以 有 些 数据 库 系 统 并 不 对 一 页 中 所 包含 的 最 小 索引 项 作 要 求 ， 只 
是 在 页 为 空 时 进行 删除 。 如 果 有 必要 ， 为 使 每 一 页 满足 至 少 包含 /2 个 索引 项 的 这 一 要 求 ， 可 
以 对 树 进行 重 构 。 

在 前 面 的 讨论 中 ， 尽 管 我 们 忽略 查找 键 值 不 是 表 的 候选 键 这 种 情况 ， 但 多 个 行 可 能 有 相 
同 的 查找 键 值 。 例 如 ， 假 设 要 在 图 11-18 中 的 B* 树 上 插入 另 一 位 名 叫 vince 的 学 生 记 录 。 使 用 规 
则 1， 必 须 分 裂 最 右边 的 叶子 节点 以 容纳 查找 键 值 为 vince 的 第 二 个 叶子 索引 ， 如 图 11-22 所 示 ， 
因而 就 必须 创建 一 个 新 的 分 类 索引 。 首 先 必须 注意 的 是 ， 页 B 上 的 查找 键 值 不 再 都 小 于 D 页 上 
索引 项 vince 的 值 。 其 次 ,- 在 查找 vince 时 ， 在 页 C 上 就 终止 ， 因 而 不 会 找到 B 页 上 的 叶子 索引 
vince。 最 后 , 如果 还 要 插入 其 他 的 名 为 vince 的 学 生 ， 在 最 低层 的 分 类 索引 级 上 (也 可 能 是 更 
高 的 一 层 上 ), -可 能 有 多 个 vince 的 分 类 索引 。 处 理 这 种 重复 的 方法 就 是 对 查找 算法 进行 修改 
以 适应 这 些 变化 。 我 们 把 修改 的 细节 留 作 练习 。 





图 11-22 在 图 11-18 的 索引 子 树 上 插入 一 个 相同 的 索引 项 vince 后 ， 导 致 叶子 页 的 分 列 


处 理 插入 相同 查找 键 值 的 另 一 个 方法 就 是 在 叶子 满 时 ， 创 建 一 个 溢出 页 。 使 用 这 种 方法 ， 
就 不 必 对 查找 算法 进行 修改 ， 但 溢出 链 会 变 得 很 长 ， 前 面 所 描述 的 树 查找 代价 估计 方法 将 不 
再 适用 。 
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11.6 散 列 索引 


在 很 多 的 计算 机 应 用 中 ， 散 列 是 一 个 非常 重要 的 查找 算法 。 在 这 一 节 ， 我 们 讨论 它 在 数 
据 库 关系 索引 上 的 使 用 。 静 态 散 列 (static hashing) 中 ， 散 列表 的 大 小 是 一 个 常量 ， 而 在 动态 
散 列 (dynamic hashing) 中 ， 表 可 以 增 大 和 缩小 。 当 一 个 关系 在 大 部 分 情况 下 是 静态 时 ， 使 
用 第 一 种 技术 比较 合适 。 当 关系 索引 涉及 经 常 的 插入 和 删除 操作 时 ， 利 用 第 二 种 技术 较 好 。 


11.6.1 静态 散 列 


散 列 索引 把 对 应 于 一 个 表 上 的 数据 记录 分 成 多 个 不 相 邻 的 子 集 ， 这 些 子 集 称 为 桶 
(bucket)， 这 与 某 个 散 列 函数 (hash function) h 相 对 应 。 当 二 条 新 的 索引 插入 某 个 特定 的 桶 
时 ， 这 取决 于 在 索引 项 上 对 查找 键 值 v 应 用 函数 h 后 的 结果 。 因 此 ，h(v) 是 桶 的 地 址 。 由 于 不 
同 的 查找 键 值 数目 通常 比 桶 的 数目 要 大 得 多 ， 所 以 某 一 个 桶 将 包含 具有 不 同 查找 键 值 的 索引 
项 。 每 一 个 桶 一 般 存储 在 一 个 页 上 (可 能 加 以 扩展 包含 一 个 溢出 链 )， 由 h(v) 标 识 。 这 种 情况 
如 图 11-23 所 示 。 





溢出 链 
散 列 计算 





图 11-23 一 个 散 列 索引 的 示意 图 


对 查找 键 值 为 "索引 项 进行 等 值 搜索 时 ， 先 计算 hv) ， 找 到 存储 在 相关 页 上 的 桶 ， 然后 扫 
描 桶 的 内 容 来 定位 查找 键 值 为 v 的 索引 项 ( 如果 有 的 话 )。 因为 没有 其 他 的 桶 具有 包含 同样 键 
值 的 项 ， 所 以 如 果 在 桶 中 没有 找到 相应 的 索引 项 ， 那 它 就 不 在 文件 中 。 因此 不 需要 维护 类 似 
于 树 的 索引 结构 ， 目 标 索引 项 的 等 值 查找 可 以 通过 只 有 一 次 MO 操作 的 检索 来 实现 (假设 没有 
溢出 链 ) 。 

和 树 索引 相 比 ， 正 确 设计 的 散 列 索引 可 以 使 等 值 查找 更 为 有 效 。 因为 对 一 个 树 索引 来 说 ， 
在 到 达 叶 子 级 之 前 ， 必 须 访问 多 个 索引 级 的 页 。 但 如 果 要 执行 一 连 串 的 等 值 查找 ， 可 能 树 索 
引 更 加 合适 。 例 如 ， 假 设 有 必要 搜索 查找 键 值 为 &, koe kiak, 该 序列 在 查找 键 值 上 是 有 
序 的 ( 即 k<kiw,)， 序 列 的 顺序 表示 检索 记录 的 顺序 。 因为 一 棵 索引 树 上 的 叶子 索引 是 按键 值 
排序 的 ， 当 检索 索引 项 时 ， 高 速 缓存 的 命中 率 就 高 。 但 对 散 列 索 引 而 言 ， 每 一 个 查找 键 值 可 
能 散 列 在 不 同 的 桶 中 ， 因 而 在 检索 序列 中 连续 的 索引 项 时 ， 高 速 缓 存 命中 率 就 会 很 低 。 这 个 
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例子 表明 : 在 评价 哪 种 索引 能 够 改善 应 用 的 性 能 时 ， 应 从 整体 上 进行 考虑 。 

尽管 散 列 索引 与 等 值 搜索 相 比 ， 优 势 很 明显 ， 但 树 索 引 通常 更 加 适用 ， 因 为 树 素 引 有 多 
”种 用 途 : 散 列 索引 不 支持 范围 和 部 分 键 值 查找 。 它 不 支持 部 分 键 值 查找 是 因为 散 列 函数 必须 
应 用 于 整个 键 。 为 理解 它 不 能 有 效 地 支持 范围 查找 的 原因 ， 考 虑 前 面 所 讨论 过 的 学 生 表 。 假 
设 使 用 一 个 散 列 索引 ， 从 文件 中 找 出 名 字 在 paul 和 tom 之 间 的 所 有 学 生 的 记录 ， 散 列 得 出 的 结 
论 是 没有 名 为 paul 的 学 生 ， 并 找 出 名 为 tom 的 索引 项 。 但 为 定位 这 一 查找 范围 内 的 相应 的 索引 
项 ， 这 是 不 够 的 ， 因 为 我 们 无 法 运用 散 列 函 数 来 搜索 这 一 范围 内 的 每 一 个 可 能 的 值 一 一 仅 有 
一 小 部 分 可 能 出 现在 数据 库 中 。 在 某 一 范围 内 ， 连 续 的 索引 项 随机 地 分 布 在 各 个 桶 中 ， 因 而 
对 这 样 的 一 个 范围 查找 所 花费 的 代价 是 和 在 这 一 范围 内 索引 项 的 数目 成 比例 的 。 在 最 坏 的 情 
况 下 ( 当 文 件 中 索引 项 的 数目 超出 页 的 数目 时 ) ， 使 用 索引 后 的 代价 可 能 大 于 只 是 扫描 整个 文 
件 所 要 付出 的 代价 ! 

相反 ， 使 用 聚 鳞 ISAM 或 B* 树 搜索 范围 内 的 数据 记录 时 ， 先 用 索引 定位 范围 内 的 第 一 条 数 
据 记 录 ， 然 后 进行 简单 的 扫描 。 进 行 简单 的 扫描 是 可 能 的 ， 因 为 文件 中 的 数据 记录 是 按 查 找 
键 顺序 维护 的 。 查 找 的 代价 和 这 个 范围 内 的 页 数 成 正比 ， 再 加 上 查找 索引 的 代价 。 最 重要 的 
差别 在 于 ，B* 树 查找 的 IO 代价 取决 于 这 一 范围 内 叶子 页 的 数目 ， 而 散 列 索引 查找 的 代价 取决 
于 这 一 范围 内 记录 的 数目 ， 而 这 种 方法 的 代价 要 大 得 多 。 

和 树 索引 一 样 ， 散 列 索 引 中 的 一 个 索引 项 可 能 包含 一 条 数据 记录 或 者 存储 一 个 指向 数据 
文件 中 数据 记录 的 指针 。 如 果 索 引 项 包含 的 是 数据 记录 ， 桶 是 作为 数据 文件 的 一 种 存储 结构 : 
数据 文件 是 桶 的 一 个 序列 。 如 果 索 引 项 包含 的 是 指向 记录 的 指针 ， 那 么 索引 项 作为 桶 的 序列 
保存 在 一 个 索引 文件 中 ， 数 据 文 件 中 的 记录 可 以 按 任 意 的 顺序 存储 。 在 这 种 情况 下 ， 散 列 索 
引 是 辅助 索引 和 非 聚 簇 的 。 如 果 同 一 个 桶 中 的 索引 项 引用 的 数据 记录 存储 在 相同 的 或 者 是 相 
邻 的 磁盘 块 上 ， 那 么 散 列 索 引 就 是 聚 簇 的 。 这 表明 含有 相同 查找 键 值 的 数据 记录 在 大 容量 存 
储 设备 上 的 物理 位 置 是 相 邻 的 。 

在 选取 散 列 函 数 时 ， 目 标 就 是 要 将 索引 项 随机 地 分 配 在 各 个 桶 中 ， 这 样 ， 索 引 表 上 的 实 
例 在 每 个 桶 中 的 数目 大 致 是 相同 的 。 例 如 ，h 可 以 定义 为 : 

h(v)=(a*xv+b) mod M 


其 中 ，a 和 2 是 常数 ， 用 于 优化 函数 随机 分 布 查找 键 值 的 方式 ，M 是 桶 的 数目 ，* 是 一 个 字符 串 ， 
在 计算 散 列 值 时 将 它 当 作 二 进 制 数 进行 处 理 。 为 简化 起 见 ， 假 设 以 后 所 有 的 算法 中 ，M 是 2 的 
倍数 (实际 上 它 是 一 个 比较 大 的 素数 )。 

我 们 刚才 所 描述 的 索引 模式 称 作 静态 散 列 (static hash )， 因 为 在 索引 被 创建 时 ，M 是 固 
EN. 静态 散 列表 的 效率 取决 于 每 个 桶 中 的 索引 适 于 放 在 一 个 页 面 上 的 程度 。 一 个 桶 中 索引 
的 数目 是 和 M 成 反比 的 : 桶 越 少 ， 桶 的 平均 填充 率 就 越 高 。 桶 的 平均 填充 率 越 高 ， 一 个 桶 能 
放 在 一 个 页 上 的 可 能 性 越 低 ， 因 而 有 必要 使 用 溢出 页 。 对 索引 操作 的 效率 而 言 ，M 的 选择 是 
关键 。 

如 果 外 是 一 个 页 面 所 能 容纳 的 最 大 索引 数 , 工 是 总 的 索引 数 ， 选 择 值 为 L/@ 的 M 可 以 产生 
只 有 一 个 溢出 页 的 桶 。 一 方面 ，h 通 常 不 能 让 索引 精确 地 分 布 在 各 个 桶 中 ， 所 以 我 们 希望 菜 些 
桶 可 以 分 配 到 多 于 中 条 的 索引 。 另 一 方面 ， 如 果 表 是 随时 间 增 长 的 ， 那 么 桶 有 可 能 溢出 。 处 





PIF REHMRARLEI 271 


理 这 种 增长 的 一 种 解决 办 法 就 是 使 用 一 个 小 于 1 的 装填 因子 来 扩大 桶 的 数目 。 每 个 桶 的 平均 填 
充 度 为 中 与 装填 因子 之 积 ， 以 便 那些 装填 数 大 于 平均 数 的 桶 能 容纳 在 一 个 页 中 。M 就 变 成 
L/(®* 装 填 因 子 )。 装 填 因子 小 于 0.5 是 不 合理 的 ， 扩 大 M 的 缺点 是 空间 的 需求 增 大 ， 因 为 有 些 
桶 中 只 有 为 数 很 少 的 几 条 索引 。 

这 一 技术 能 够 减少 溢出 问题 ,但 没有 完全 解决 溢出 问题 ， 部 分 原因 是 因为 一 些 表 的 增长 
事先 是 不 能 预测 的 。 因 而 必须 处 理 桶 的 溢出 ， 这 可 以 使 用 如 图 11-23 所 示 的 溢出 链 来 解决 。 但 
是 ， 对 一 个 ISAM 索 引 来 说 ,溢出 链 是 低 效 的 。 因 为 对 一 个 等 值 查找 ， 必 须 扫 描 所 有 的 桶 ， 查 
找 一 个 存储 在 x 个 页 面 上 的 桶 需要 n 次 1/O 操 作 。 这 在 一 个 理想 的 查找 代价 上 筠 上 n， 但 研究 表 
明 ， 对 一 个 好 的 散 列 函数 而 言 ，"=1.2。 


11.6.2 动态 散 列 算法 


正如 调整 树 索 引得 到 B* 树 以 适应 动态 表 一 样 ， 也 可 以 调整 静态 散 列 得 到 动态 散 列 方案 来 
处 理 同 样 的 问题 。 动 态 散 列 的 目标 就 是 动态 地 改变 桶 的 数目 ， 从 而 在 插入 行 和 删除 行 时 减少 
或 消除 溢出 链 。 有 两 种 动态 散 列 算法 倍 受 关注 ， 它 们 是 可 扩展 的 散 列 和 线性 散 列 ， 下 面 将 简 
短 地 讨论 这 两 种 算法 。 

静态 散 列 使 用 一 个 固定 的 散 列 函数 4， 它 把 所 有 可 能 的 查找 键 值 分 成 5 (1 <i<M) 个 子 
集 ， 将 每 一 个 子 集 映 射 到 一 个 桶 B;，5; 中 的 每 一 个 元 素 v 可 用 h(v) 来 标识 桶 B;。 动 态 散 列 方案 可 
以 将 5; 在 运行 过 程 中 被 分 成 不 相 邻 的 $; 和 5S;， 将 B 分 成 Bi 和 B;， 这 样 ，5; 上 的 元 素 映 射 到 桶 B;， 
S$; 上 的 元 素 映射 到 桶 B,'。 通 过 减少 映射 到 桶 上 的 键 值 数 ， 一 个 分 裂 可 以 将 一 个 溢出 的 桶 用 两 
个 非 满 的 桶 来 代替 。 映 射 的 变化 预示 在 分 裂 一 个 桶 时 (或 合并 两 个 桶 ) 考虑 了 散 列 函数 的 变 
化 。 可 扩展 的 散 列 和 线性 散 列 以 两 种 不 同 的 方法 来 完成 这 个 映射 。 

1. 可 扩展 的 散 列 . 

可 扩展 的 散 列 使 用 一 个 基于 散 列 函数 h 的 散 列 函 数 序列 h, hh,…,h， 它 把 查找 键 值 散 列 成 
一 个 b 位 的 整数 。 对 每 一 个 :，0 <k<5，hilv) 是 由 h(v) 的 最 后 k 位 组 成 的 一 个 整数 。 其 数学 表达 
式 为 

hi (v) = h(v) mod 2* 

因此 ， 每 个 函数 及 的 范围 是 久 -! 的 两 倍 。 在 任何 给 定 的 时 间 内 ， 序列 中 的 一 个 特定 函数 用 支持 
所 有 的 查询 。 

和 静态 散 列 不 一 样 ， 动 态 散 列 使 用 一 /4 二 次 散 列 来 确定 与 桶 相关 联 的 查找 键 值 v。 如 图 11- 
24 所 示 ， 这 种 映射 是 通过 一 个 目录 来 闻 接 执行 的 。 由 h(v) 所 产生 的 值 作为 一 条 索引 放 在 目录 
中 ， 目 录 中 的 指针 指向 与 y 相 关联 的 桶 。 目 录 中 不 同 项 可 能 指向 同一 个 桶 ， 所 以 即使 (v1) 和 
hi(v2) 的 值 不 同 ，v1 和 v2 也 可 能 映射 到 同一 个 桶 。 

为 理解 这 一 过 程 ， 假 设 散 列 函 数 h 是 0 到 21-1 之 间 的 一 个 整数 集 。 在 图 11-24 中 ， 我 们 假设 
一 个 桶 的 页 能 容纳 两 个 索引 项 。 该 图 描述 某 一 时 刻 用 h 对 查找 键 值 进行 散 列 的 算法 (因此 ， 
目录 中 包含 有 2?=4 个 索引 项 )。 因 为 h 仅 用 A 范围 内 的 值 的 最 后 两 位 ， 所 以 数字 可 以 由 下 面 的 函 
数 h 来 产生 : 
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v h(v) 

pete 1001111010 
mary 0100000000 
jane 1100011110 
bill 0100000000 
john 0001101001 
vince 1101110101 
karen 0000110111 


因而 /将 pete 散 列 成 1001111010， 但 和 包 只 用 最 后 的 两 位 ， 表 示 目 录 的 第 三 项 ， 它 指向 B,。 





图 11-24 可 扩展 的 散 列 通 过 一 个 目录 将 散 列 结果 映射 到 桶 


现在 我 们 假设 要 插入 一 个 记录 sol 到 表 中 ，h(sol)=0001010001， hs 将 john、vince、sol 都 映 
射 到 B,， 导 致 游 出 。 不 是 创建 一 个 溢出 链 ， 而 是 可 扩展 的 散 列 将 BI 分 裂 ， 产 生 一 个 新 桶 B;， 
如 图 11-25 所 示 。 为 容纳 5 个 桶 ， 有 必要 使 用 一 个 包含 多 于 4 个 值 的 散 列 函数 ， 因 此 用 如来 代替 
h。 由 于 hs 的 最 高 一 位 hs(john)=0，ha(vince)=1 是 不 同 的 (而 低 商 位 01 是 相同 的 )，h; 通 过 把 
john 和 vince 映 射 到 不 同 的 桶 而 避免 溢出 (bh; 做 不 到 )。 在 图 11-25 中 ， 注 意 ， 如 果 v1 和 v2 是 B， 
(或 B;) 的 元 素 ， 则 h(v1) 和 h(v2) 的 最 后 三 位 是 相等 的 。 

需要 一 个 目录 来 补充 只 有 BI 需要 分 裂 的 事实 。 实 际 上 ，h; 不 仅 把 john 和 vince 区 分 开 来 ， 
而 且 对 pete(010) 和 jane(110) 产 生 不 同 的 值 。 因 此 ， 如 果 没 有 目录 ， 那 么 当 用 忆 坎 换 记 时 ， 就 
有 必要 对 有 进行 分 裂 。 通 过 在 散 列 计算 和 桶 之 间 插 入 一 个 目录 ， 我 们 可 以 将 pete 和 jane 都 映 
射 到 B,， 这 是 通过 在 目录 中 的 第 三 项 (010) 和 第 七 项 (110) 中 存储 一 个 指向 B; 的 指针 来 实现 的 。 
结果 是 ， 与 8, 和 Bs 相反 ， 如 果 v1 和 v2 都 吕 B, 的 元 素 ， 那 么 h(v1) 和 h(v2) 只 是 在 它们 的 最 后 两 位 
上 相等 。 | 

把 图 11-24 转 换 到 图 11-25 的 算法 相当 简单 : 

1) 分 配 一 个 新 桶 B'， 使 用 序列 中 的 下 一 个 散 列 函数 将 溢出 桶 B 中 的 内 容 分 裂 到 B 和 B' 中 。 

2) 通过 与 复制 旧 目 录 中 相关 内 容 来 创建 一 个 新 目录 。 

3) 将 拷贝 中 指向 B 的 指针 用 指向 B' 的 指针 来 代替 。 
因此 ， 除 第 二 项 和 第 六 项 的 指针 外 【这 是 桶 被 分 裂 后 的 两 部 分 )， 图 11-25 中 目录 的 两 部 分 是 
一 致 的 。 
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图 11-25 使 用 可 扩展 的 散 列 ， 图 11-24 中 的 桶 B, 被 分 裂 


为 给 出 算法 的 一 个 完整 的 描述 ， 我 们 必须 处 理 一 些 其 他 问题 。 首 先 ， 我 们 怎么 能 够 知道 
执行 查找 操作 时 使 用 的 是 序列 中 的 哪 一 个 散 列 函数 ? 这 是 很 容易 实现 的 ， 我 们 只 需要 将 当前 
散 列 函 数 的 索引 与 目录 一 起 存储 即 可 。 我 们 假设 用 一 个 变量 current_hash 来 完成 这 一 功能 ， 它 
被 初始 化 为 0 ( 仅 有 一 个 目录 项 )。 一 般 来 说 ， 目 录 项 的 数目 是 2 。 在 图 11-24 中 ， 
current_hash 的 值 是 2 (没有 显示 出 来 )， 在 图 11-25 中 ，current_hash 的 值 是 3。 

如 果 下 面 要 插 和 人 关于 judy 的 一 行 ，A(judy)=1110000110， 会 出 现 一 企 更 加 复杂 的 问题 ， 这 
是 我 们 应 该 考虑 的 。 在 图 11-25 中 ，judy 被 映射 到 B,， 这 导致 桶 溢出 ， 必 须 对 桶 进行 分 裂 。 但 
这 却 不 同 于 导致 我 们 将 hs 赫 换 成 hs 的 情形 ， 因 为 h; 本 身 能 够 将 映射 到 B, 的 索引 项 区 分 开 来 (B 
中 索引 项 的 散 列 值 只 在 它们 的 最 后 两 位 上 是 相等 的 ) 。 在 这 个 例子 中 ， 心 将 judy 和 jane (110) 
与 pete(010) 区 分 开 来 。 所 以 不 是 使 用 一 个 新 的 散 列 函数 来 处 理 溢出 ， 我 们 只 需要 为 judy 和 jane 
创建 一 个 新 的 桶 ， 然 后 对 目录 中 相应 的 指针 进行 更 新 。 如 图 11-26 所 示 ， 新 桶 标记 为 B6。 

这 是 目录 此 时 不 必 扩 大 的 一 个 原因 。 每 次 扩大 目录 时 ,目录 能 存储 该 时 刻 指向 每 一 个 桶 
的 指针 ,事实 上 ， 仅 有 一 个 桶 分 裂 。 因 此 ， 在 扩展 一 个 目录 时 ， .几乎 只 有 一 个 指针 指向 原来 
的 桶 。 图 11-25 中 的 目录 是 为 Bi 的 分 裂 而 创建 的 ， 所 以 在 新 目录 中 只 有 一 项 101 指 向 新 桶 。 因 
为 项 010 和 110 都 指向 B,，， 所 以 目录 不 需要 进一步 扩大 就 能 适应 B, 的 分 裂 。， 

通过 存储 每 一 个 桶 和 桶 已 经 分 裂 的 次 数 ， 对 我 们 可 以 检测 出 这 种 情形 ， 我 们 把 这 个 值 称 
为 bucket level， 并 与 一 个 变量 bucket_level[i] 相 关联 。 在 开始 时 ， bucket_level[0] 的 值 为 0， 当 
8 分 裂 时 ， 我 们 使 用 bucket_level[i]+1 来 作为 B 的 bucket leyel 和 新 产生 的 桶 。 因 为 每 况 目 录 扩 
大 时 ，B, 不 进行 分 裂 ， 我 们 让 目录 中 指向 B, 的 指针 加 倍 。 目 录 中 指向 B, 的 指针 数 是 
DENTE NN NE LD | MH, “4— DI, AS ths ae IAA AHH, 所 以 如 果 
”1 和 v2 都 是 8 的 元 素 ， 那 么 KWy1) 和 Arv2) 在 它们 的 最 后 的 bucket_level[ 训 位 上 是 相等 的 。 

在 图 11-25 和 图 11-26 中 ，bucket_level[1] 都 是 3 (在 图 11-25 中 没有 表示 出 来 )， 而 图 11-25 
中 的 bucket_level[2] 是 2， 图 11-26 中 的 bucket_level[2] 增 加 到 3。 
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bucket_level [6] 


”图 11-26 ,不 扩充 目录 ; 分 裂 图 11-25 中 的 精 B， 


使 用 分 裂 算 法 的 逆 可 以 合并 两 个 桶 。 如 果 删 除 一 个 索引 项 导致 二 个 精 B' 为 空 ， 商 PB 和 8" 是 
在 8 分 裂 时 产生 的 ， 则 可 以 让 目录 中 指向 B' 的 指针 指向 B"、 让 8B" 的 bucket_level 减 1 就 可 以 释放 
B'。 另 外 ， 当 合并 之 后 所 产生 的 目录 上 半 部 分 和 下 半 部 分 相同 时 ， 其 中 一 半 可 以 其 放 ， 
current_hash 减 1。 一 般 不 进行 合并 操作 ， 因 为 假设 尽管 一 一 个 表 暂 时 会 收缩 但 从 长 远 来 看 ， 
它 还 是 可 能 会 扩大 ， 所 以 合并 最 终 会 跟随 着 一 个 分 裂 ， 

当 索 引 项 的 数目 增加 时 可 扩展 的 散 列 消除 大 多 数 用 静态 散 列 开发 的 溢出 链 . 但 它 有 几 
个 缺点 。 第 一 ， 它 需要 额外 的 空间 来 存储 目录 。 第 二 ， 由 自 示 间接 定位 缓冲 区 需要 额外 的 时 
间 开销 。 如 果 目 录 很 小 ， 它 可 以 保存 在 主 存 中 ， 所 以 这 些 缺 点 都 不 是 主要 问题 。 这 时 ， 目 录 
的 访问 不 需要 额外 的 IO 操作 。 但 一 个 目录 变 得 相当 天 的 时 候 ， 如 果 它 不 能 放 在 主 存 中 ， 那 么 
可 扩展 散 列 的 TO 开销 是 静态 散 列 的 两 倍 。 最 后 ， 分 裂 桶 并 不 能 将 二 个 桶 中 的 内 容 分 开 而 消除 
溢出 。 例 如 ， 当 一 个 溢出 由 多 个 具有 相同 查找 键 值 的 索引 项 引起 时 ， 分 裂 并 不 能 消除 溢出 。 

2. 线性 散 列 

由 于 可 扩展 散 列 的 缺点 是 由 目录 的 引入 而 引起 的 ， 我 们 自然 会 想到 开发 不 需要 目录 的 动 
态 散 列 模式 。 可 扩展 散 列 需要 一 个 目录 是 因为 当 一 个 桶 分 裂 时 ， 有 必要 切换 到 一 个 有 更 大 范 
围 的 散 列 函 数 : 存储 在 不 同 桶 中 的 查找 键 值 必 须 散 鹿 成 不 周 的 值 ， 因 此 ， hi 所 包含 的 元 素数 
荐 hh 的 两 倍 ， 所 以 h(v) 和 hm(w) 是 不 相等 的 。 但 如 果 v 是 非 分 烈 桶 中 的 二 个 元 素 ， 那么 在 分 裂 前 
和 分 裂 后 ， 索引 必须 能 让 查询 找到 这 个 桶 。 目 录 可 以 解决 这 个 问题 。 

这 个 问题 可 以 通过 不 使 用 目录 来 解决 吗 ? 一 种 可 能 的 解决 办 法 就 使 用 相同 的 散 列 函数 序 
BM ho, h…,h。， 这 和 可 扩展 的 散 列 一 祥 ， 但 不 同 的 是 妨 和 ,1 同时 使 用 : hh 用 于 没有 分 裂 的 桶 中 
的 值 ，hw 用 于 分 裂 的 桶 中 的 值 。 这 种 方法 的 优点 是 : 它 为 分 烈 前 和 分 裂 后 与 分 裂 无 关 的 桶 的 
查找 键 值 提供 相同 的 映射 。 决 窍 在 于 当 通 过 索引 开始 一 个 查找 时 ， 它 能 告诉 我 们 使 用 的 是 哪 
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一 个 散 列 函数 。 

使 用 线性 散 列 ， 桶 的 分 裂 分 为 多 个 阶段 。 处 于 开始 阶段 的 桶 连续 分 裂 ， 所 以 最 后 阶段 桶 
的 数目 是 开始 阶段 桶 数目 的 两 倍 。 这 一 过 程 如 图 11-27 所 示 。 阶 段 是 有 编号 的 ; 当前 阶段 的 编 
号 保存 在 变量 current_stage 中 。 图 中 current_stage 的 值 是 :， 这 表明 使 用 的 散 列 函 数 是 名 和 1。 
在 开始 时 ，current_stage 的 值 为 0%， 只 有 一 个 桶 。 变 量 next 表 示 序列 中 下 一 个 要 分 裂 的 桶 . 


在 阶段 开始 处 
存在 的 2 个 桶 


在 阶段 ;要 创建 
的 新 桶 








11-27 线性 散 列 连 续 地 对 桶 进 和 分裂， 阴影 部 分 的 桶 是 通过 hh;,, 来 访问 的 


当 第 i 个 阶段 开始 时 ， 有 2 个 桶 ， 范 围 为 {0…2:=1} 的 散 列 函数 h 散 列 查找 键 值 。 定 期 做 出 
分 裂 桶 的 决策 (我 们 暂时 回 到 这 个 问题 上 来 )，next 的 值 用 来 决定 对 开始 阶段 的 哪 一 个 桶 进行 
分 裂 。 在 开始 阶段 ，next 初 始 化 为 0， 在 发 生 分 裂 时 加 1。 因 此 ， 桶 连续 地 进行 分 裂 ，next 把 那 
些 当前 阶段 已 经 分 裂 的 桶 和 那些 没有 分 裂 的 桶 区 分 开 来 。 由 于 next 指 向 下 一 个 要 分 裂 的 桶 ， 
索引 号 小 于 next 的 桶 在 这 一 阶段 已 经 分 裂 (分 裂 的 桶 在 图 中 以 阴影 部 分 的 形式 出 现 )。 当 有 2 
个 桶 存在 时 ， 第 i 个 阶段 已 经 完成 。 

当 桶 Bnet 分裂 时 ， 新 创建 的 桶 有 next+2' 条 索引 。B,ew 的 元 素 使 用 h,,1 来 分 割 : 如 果 v 是 Brox 
的 一 个 元 素 ， 且 hiwi(v)=hi(v)， 那 么 它 将 留 在 原来 的 桶 中 ， 否则 就 移 到 Bscwwz! 中 。 当 next 的 值 达 
到 2 时 ， 一 个 新 的 阶段 开始 ， 将 next 重 新 设置 为 0，current_stage 加 1。 

当 一 个 查找 作用 在 查找 键 v 上 时 ， 就 计算 h(v)。 如 果 iiext < Kilv)<21， 就 为 了 v 扫 描 hi(v) 表 示 
的 桶 。 如 果 0 < hi(v)<next， 说 明 由 hx(v) 表 示 的 桶 已 经 分 裂 ，hi(v) 不 能 提供 挟 够 的 信息 来 确定 是 
应 该 扫描 B,(v) 桶 还 是 Bi(wzi 桶 。 但 在 分 裂 时 ， 使 用 hi 来 对 元 素 进行 分 割 ， 我 们 可 以 使 用 sa(v) 
确定 在 哪个 桶 中 查找 。 

重要 的 一 点 是 ， 在 线性 散 列 中 ， 被 分 割 的 桶 不 一 定 溢出 。 当 一 个 桶 及 溢出 时 ， 我 们 可 能 
决定 对 桶 进行 分 裂 ， 但 被 分 裂 的 桶 是 B,。， next 的 值 可 能 不 同 于 j。 注 意 ， 在 图 11-27 中 ， 
next=4， 这 表明 B。、Bl、B, 和 Bs 已 经 分 裂 。 特 别 是 当 B; 为 空 ， 没有 发 生 溢出 时 ， 也 被 分 裂 。 所 
以 ,线性 散 列 不 能 消除 溢出 链 ( 这 样 ， 就 必须 为 B 创 建 一 个 游 出 页 )。 但 最 终 B 将 被 分 裂 ， 


276 PRD KEFFA 


为 处 在 当前 开始 阶段 的 每 一 个 桶 在 这 一 阶段 结束 时 都 要 分 裂 。 所 以 尽管 可 能 要 为 一 个 桶 8 创 
建 一 个 溢出 链 ， 但 链 通常 很 短 ， 一 般 在 下 次 分 裂 8 时 就 消除 。 一 个 溢出 页 的 平均 生命 期 随 着 
频繁 的 分 裂 而 缩短 。 尽 管 这 样 做 的 代价 只 需要 很 少 的 空间 ， 因 为 每 一 个 阶段 ， 没 有 溢出 的 桶 

假设 分 裂 每 次 都 在 一 个 溢出 页 被 创建 之 后 发 上 生 ， 图 11-28 显 示 当 一 个 线性 索引 从 图 11:24 的 
与 可 扩展 的 散 列 相同 的 状态 开始 并 经 历 相同 的 后 续 插入 时 ， 一 个 线性 索引 所 经 历 的 一 系列 阶 
段 。 在 图 11-28a 中 ， 我 们 假设 索引 正好 进入 第 二 个 阶段 ， 图 各-28b 表 示 将 sol 插 入 到 2B 之 后 的 
结果 。 尽 管 B 发 生 溢出 ， 但 分 裂 的 是 Bo， 因为 此 时 next 的 值 为 0。 注意 ，mary 和 bill 都 被 记 散 列 
到 Bo，B4 为 空 。 图 11-28c 表 示 将 judy 插 入 到 B 中 ， 现 在 是 B 分 烈 ， 消除 它 的 溢出 链 ， 但 为 B, 创 
建 一 个 新 的 溢出 链 。 


current, stage $ 2 | 








图 11-28 a) 在 开始 阶段 一 个 线性 散 列 索引 的 状态 ; 
b 插入 sol 之 后 的 状态 ; c) 插入 judy 之 后 的 状态 
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可 以 看 到 ， 线 性 散 列 分 裂 的 不 是 所 要 分 裂 的 桶 ， 这 就 是 为 避免 使 用 目录 而 付出 的 代价 。 
按 笑 序 分裂 桶 很 容易 将 已 分 裂 的 桶 和 未 分 裂 的 桶 区 分 开 来 。 尽 管线 性 散 列 有 溢出 链 ， 但 不 必 
为 目录 的 存 取 而 付出 额外 的 开销 。 


11.7 特殊 用 途 的 索引 


到 现在 为 止 ， 所 介绍 的 索引 结构 可 用 于 多 种 情形 ， 但 还 有 一 些 索 引 结构 只 适用 于 一 些 特 
殊 的 情况 ， 但 能 节约 大 量 的 存储 空间 和 处 理 时 间 。 我 们 来 讨论 两 种 这 样 的 技术 : 位 图 索引 和 
联接 索引 。 


11.7.1 位 图 索引 


位 图 索引 (Bitmap index) [O’Neil 1987] 是 作为 一 个 或 多 个 位 向 量 来 实现 的 。 这 对 一 些 只 
能 取 很 少 值 的 属性 来 说 非常 合适 。 例 如 ， 关 系 PERSON 上 的 Sex 属 性 只 能 取 两 个 值 : Male 和 
Female。 假 设 PERsoN 共 有 40 000 行 ，PERsoN 上 的 位 图 索引 是 一 个 含有 两 位 的 向 量 ， 其 中 一 位 
用 于 Sex 可 能 的 值 ， 每 一 个 位 向 量 包含 40 000 个 位 ， 另 一 位 用 于 PERsoN 的 每 一 行 。 因 此 ， 如 果 
PERSON 中 的 第 1 行 的 性 别 属性 值 为 Male， 那 么 Male 位 向 量 的 第 i 位 是 1。 结 果 ， 我 们 可 以 通过 扫 
描 Male 位 向 量 来 确定 属性 为 Male 的 行 数 。 如 果 给 定 行 数 ， 我 们 就 能 计算 出 从 数据 文件 开始 端 
的 位 移 ， 直 接 从 磁盘 上 访问 想 要 找 的 行 。 l 

注意 ， 例 子 中 存储 索引 的 空间 正好 是 80 000 位 ， 即 10K 字 节 ， 它 是 可 以 放 在 主 存 中 的 。 因 
为 全 部 在 主 存 中 实现 ， 所 以 查找 这 样 的 索引 可 以 通过 顺序 扫描 来 快速 实现 。 

尔 可 能 已 经 注意 到 ， 和 位 图 索引 实际 需要 的 空间 相 比 ， 位 图 索引 浪费 了 更 多 的 空间 。 事 
实 上 ， 编 码 Sex 属 性 我 们 使 用 两 位 ， 而 实际 只 要 1 位 就 能 编码 所 有 可 能 的 值 。 这 样 做 的 原因 是 ， 
位 图 索引 的 目的 是 提高 效率 ， 特 别 是 提高 在 两 个 属性 或 多 个 属性 上 进行 选择 时 的 效率 。 为 更 
加 清楚 地 进行 说 明 ， 假 设 关系 PERSoN 表 示 一 次 健康 调查 的 结果 ， 其 中 有 属性 Smoker 和 
HasHeartDisease ， 这 两 个 属性 只 接受 Yes 和 No 两 个 属性 值 。 一 个 查询 是 在 一 特定 的 年 龄 群体 
中 找 出 吸烟 但 没有 心脏 病 的 男性 公民 人 数 。 作 为 查询 的 一 部 分 ， 我 们 有 以 下 的 条 件 选择 : 


Sex = 'Male' AND Smoker = 'Yes' AND HasHeartDisease = 'No' 


如 果 以 上 的 三 个 属性 都 有 位 索引 ， 那 么 我 们 就 能 很 容易 地 找到 满足 这 一 条 件 的 所 有 元 组 : 
在 Sex 属 性 为 Male、Smoker 属 性 为 Yes、HasHeartDisease 属 性 为 No 的 值 的 位 串 取 逻辑 AND， 
满足 条 件 的 元 组 在 结果 位 串 中 相应 的 位 上 取 1。 

更 一 般 的 情况 是 ， 位 图 索引 能 处 理 包含 OR 和 NOT 的 条 件 选择 一 一 所 有 我 们 要 做 的 就 是 计 
算 相 应 位 串 中 合适 位 的 布尔 值 。 例 如 ， 假 设 Age 属 性 有 一 个 120 位 的 位 图 索引 ，PERsoN 中 的 每 
一 条 记录 需要 120 位 的 开销 。 这 是 可 以 接受 的 ， 无 论 如 何 ，PERsoN 每 条 记录 的 一 个 常规 索引 至 
少 要 8 个 字 节 (64 位 )。 现在， 我 们 应 能 高 效 地 找到 年 龄 在 50 岁 ~ 80 岁 之 间 吸 烟 的 男性 公民 ， 
而 他 们 从 来 没有 犯 过 心脏 病 。 首 先 计算 以 上 所 描述 的 三 个 位 串 的 逻辑 AND 值 ， 然 后 计算 Age 
属性 上 位 图 索引 中 年 龄 在 50 岁 ~ 80 岁 之 间 相 应 位 串 的 逻辑 OR 值 ， 最 后 计算 这 两 个 结果 的 逻辑 
AND 值 。 还 有 ， 位 串 的 最 后 一 位 给 出 我 们 所 要 查询 记录 的 ID 值 。 

正如 第 19 章 将 要 讨论 的 ， 位 图 索引 在 数据 挖掘 和 OLAP (联机 分 析 处 理 ) 应 用 中 起 着 重要 
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的 作用 。 它 们 受 欢 迎 的 原因 是 ， 这 样 的 一 些 应 用 通常 处 理 低 基 数 属性 ， 例 如 : 性 别 、 年 龄 、 
公司 地 点 、 财 政 期 等 属性 ， 而 且 这 些 应 用 所 操作 的 数据 是 相对 静止 的 ， 当 数据 频繁 变化 时 ， 
位 图 索引 的 维护 是 比较 昂贵 的 (考虑 数据 文件 记录 的 插入 和 删除 对 一 个 位 图 索引 的 修改 )。 


11.7.2 联结 索引 


假设 我 们 要 加 快 两 个 关系 的 等 值 联 结 速度 ， 如 Przqa-sQ。 联 结 索引 [Valduriez 1987] 是 一 个 
由 形 如 <p,q> 的 对 所 组 成 的 一 个 集合 ， 这 里 的 p 是 关系 P 中 的 一 个 元 组 t 的 rid，q 是 关系 Q 中 的 一 
个 元 组 s 的 rid， 此 时 (LA=s.B ( 即 这 两 个 元 组 联结 时 )。 

一 个 联结 索引 通常 按 词典 顺序 升序 排列 。 因 此 ，<3,3> 在 <4,2> 之 前 ， 这 样 的 索引 也 可 以 
组 织 成 B* 树 或 散 列表 的 形式 。 一 棵 B* 树 中 各 项 的 查找 键 值 是 关系 P 中 行 的 rid， 为 查找 到 关系 Q 
中 与 关系 P 的 一 行 p 联 结 的 所 有 行 的 rid，p 的 叶子 索引 (如果 它们 存在 的 话 ) 包含 请 求 的 rid。 
类 似 地 ， 为 找到 包含 查找 项 的 桶 ， 散 列 索引 对 p 进 行 散 列 。 这 些 项 包含 关系 Q 中 与 关系 P 的 一 
行 p 联 结 的 所 有 行 元 素 。 

一 个 联结 索引 可 以 被 看 作 是 一 个 预先 计算 的 联结 ， 它 以 压缩 的 形式 保存 。 尽 管 计算 它 首 
先 可 能 需要 执行 常规 联结 ， 它 的 优点 ( 除 它 的 压缩 尺寸 ) 在 于 它 可 以 递增 地 保存 : 当 有 新 的 
元 组 添加 到 P 或 Q 中 时 ， 新 的 索引 项 可 以 添加 到 联结 索引 ， 而 不 必 从 头 开始 重新 计算 整个 索引 
(练习 11-24)。 

给 定 一 个 联结 索引 IJ， 通 过 简单 地 扫描 J 来 寻找 匹配 的 p 和 q， 系 统 能 够 计算 出 Pds-sQ。 注 
意 ， 如 果 J 在 P 的 字段 上 是 有 序 的 ， 则 相应 于 P 的 元 组 的 rid 是 以 升序 的 形式 出 现 的 。 因 此 ， 联 结 
是 以 一 次 扫描 索引 和 P 来 完成 计算 的 。 对 Q 中 一 个 元 组 的 每 一 个 rid， 都 要 访问 一 次 Q。 

值得 一 提 的 是 ， 联 结 索 引 的 一 种 变 体 被 称 为 位 图 联结 索引 (bitmapped join index) 
[O Neil and Graefe 1995]。 还 记得 一 个 联结 索引 通常 组 织 成 一 个 顺序 文件 ， 一 个 散 列 文件 ， 或 
是 一 棵 B' 树 ， 以 便 很 容易 地 找到 Q 中 与 关系 P 的 一 行 p 联 结 的 所 有 行 的 元 素 。 我 们 可 以 以 下 列 
方式 合并 Q 中 的 这 些 rid: 对 P 中 的 每 一 个 rid p， 在 J 中 用 <p,Q 中 相 匹 配 的 位 图 > 来 替换 所 有 的 
<p,q> 形 式 的 元 组 。 当 且 仅 当 Q 中 的 第 i 个 元 组 与 P 中 的 元 组 p 相 联结 时 ， 位 图 的 第 i 位 为 1。 这 样 
看 起 来 好 像 浪 费 了 大 量 的 空间 ， 因 为 每 一 个 位 图 的 位 数 是 和 Q 中 的 元 组 数 相等 的 。 但 位 图 容易 
被 压缩 ， 所 以 这 不 是 主要 问题 。 另 一 方面 ， 位 图 联结 索引 能 加 速 多 个 关系 的 联结 ， 正 如 13.5 
节 所 阐述 的 ， 用 空间 来 换 时 间 是 值得 的 。 


11.8 调整 问题 : 为 一 个 应 用 选择 索引 


每 一 类 索引 都 能 改善 某 类 特定 查询 的 性 能 ， 因 此 ， 在 选择 支持 某 种 应 用 的 索引 时 ， 了 解 
可 能 要 执行 的 查询 和 它们 执行 的 频率 是 非常 重要 的 。 为 一 个 很 少 执行 的 查询 添加 一 个 索引 以 
改善 其 性 能 是 不 明智 的 ， 因 为 每 添加 一 个 索引 就 会 添加 额外 的 开销 ， 对 于 那些 更 新 数据 库 的 
操作 来 说 更 是 如 此 。 

例如 ， 把 StudId 指 定 为 一 个 参数 的 查询 (11.2) 是 经 常 执行 的 ， 增 加 一 个 索引 就 能 确保 查 
询 的 快速 响应 。 这 样 一 个 索引 的 查找 键 是 从 WHERE 子 句 (不 是 SELECT 子 句 ) 中 的 列 选择 得 
到 的 ， 因 为 这 些 列 定义 查找 的 方向 。 这 样 ， 在 查找 键 值 为 StudId 的 TRANscRIPT 表 上 的 一 个 索引 
是 非常 有 用 的 。 与 扫描 整个 表 来 查找 StudId 为 111111111 的 行 相 反 ， 定 位 机 制 先 找到 包含 查找 
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键 值 的 索引 项 。 每 一 个 索引 项 既 包 含 记录 又 包含 记录 的 元 素 。 因 此 、 当 一 个 扫描 要 求 检 索 数 
据 文件 一 半 (平均 ) 以 上 的 页 时 ， 通 过 索引 访问 仅 需 一 次 检索 。 另 一 方面 ， 对 查询 (11.3), 
在 StudId 上 建立 索引 是 无 益 的 。 

但 如 果 我 们 要 支持 查询 


SELECT T.Grade 
FROM TRANSCRIPT T (11.5) 
WHERE T.StudId = '111111111' AND T.Semester = 'F1997' 


我 们 可 以 选择 在 StudId 和 Semester 上 创建 一 个 多 属性 索引 。 但 如 果 我 们 选择 把 索引 限制 在 一 个 
属性 上 《或许 是 为 支持 其 他 查询 ， 避 免 太 多 的 索引 ) ， 那 么 哪 一 个 属性 是 它 的 查找 键 昵 ? 一 般 
来 说 ， 选 择 最 具 可 选 性 的 属性 。 如 果 在 StudId 上 创建 一 个 索引 ， 那 么 数据 库 系统 使 用 它 提取 所 
有 的 行 来 找 一 名 学 生 ， 然 后 搜索 结果 ， 并 把 这 些 行 作为 目标 Semester 保 存 下 来 。 在 搜索 
Semester 时 ， 这 会 比 提取 所 有 的 行 更 加 有 效 。 因 为 对 给 定 的 学 生 ， 这 里 有 更 多 的 行 是 针对 给 
定 的 学 期 的 。 一 般 来 说 ， 仅 有 为 数 不 多 的 几 个 从 的 属性 (例如 Sex) 是 不 可 能 作为 查找 全 的 。 

在 选择 查找 键 时 ， 可 参考 下 面 的 几 点 指导 : 

1) 用 作 联 结 条 件 的 一 列 可 用 作 索引 。 

2) 用 在 ORDERBY 子 句 中 ， 一 列 上 的 聚焦 B* 树 索引 可 用 来 按 特 定 顺序 检索 行 

3) 候选 键 上 的 索引 能 有 效 地 加 强 唯一 性 约束 。 

4) 用 于 范围 查找 中 的 聚 敌 B" 树 索引 能 快速 检索 特定 范围 内 的 元 素 。 

如 果 性 能 问题 是 吞吐 量 的 问题 ， 我 们 首先 必须 确定 导致 问题 的 查询 类 型 。 一 种 是 经 常 使 
用 的 查询 ， 另 一 种 是 长 时 间 运 行 的 查询 ， 它 访问 多 个 表 ， 并 做 大 量 的 计算 。 对 这 两 种 情况 ， 
一 旦 查询 的 问题 被 确定 ， 就 可 以 添加 合适 的 索引 (或 多 个 索引 ) 可 用 来 加 速 查询 的 执行 

正如 我 们 将 在 24.3.1 节 中 要 看 到 的 ， 索 引 通 过 增加 允许 的 并 发 数 来 提高 性 能 。 一 些 并 发 控 
制 使 用 加 锁 协 议 ， 其 中 包括 为 索引 页 加 锁 。 如 果 存 在 合适 的 索引 ， 协 议 就 能 避免 对 整个 文件 
上 锁 。 因 为 和 锁 住 整个 文件 相 比 ， 对 一 个 索引 加 锁 可 以 减少 限制 ， 加 锁 增 加 数据 库 上 并 发 执 
行 的 操作 数 ， 因 而 改善 了 性 能 。 这 类 性 能 的 改善 有 时 是 选择 索引 的 基础 。 


11.9 参考 书目 


B 树 是 在 [Bayer and McCreight 1972] 中 介绍 的 ，B+ 树 首先 出 现在 区 nuth 1973] 中 。 这 本 书 的 最 新 版 
本 [Knuth 1998] 涵 盖 本 章 介 绍 的 大 部 分 内 容 。 散 列 作 为 一 种 数据 结构 首先 在 [Peterson 1957] 讨 论 。 线 性 散 
列 是 在 [Litwin 1980] 中 提出 的 ， 可 扩展 的 散 列 是 在 [Fagin et al. 1979] 中 提出 来 的 。[Larson 1981] 分 析 了 
顺序 索引 文件 。 

联结 索引 首先 是 在 [Valduriez 1987] 中 提出 的 ，[O'Neil 1987] 第 一 次 描述 了 位 图 索引 。 位 图 映射 联结 
索引 是 在 [O'Neil and Graefe 1995] 中 介绍 的 。 


11.10 练习 


11.1 说 明 下 列 机 器 的 存储 容量 、 遍 区 大 小 、 页 大 小 、 寻 道 时 间 、 旋 转 延 迟 和 磁盘 的 传输 时 间 。 
a. 你 的 本 地 PC 机 
b. 你 所 在 学 校 提供 的 服务 器 





11.2 试 解释 等 值 搜索 和 范围 搜索 的 区 别 。 
11.3 a. 对 你 所 在 的 城市 或 城镇 的 电话 号 码 矫 ， 执 行 一 个 二 分 查找 ， 试 给 出 必须 查找 页 数 的 一 个 上 界 。 
b. 如 果 给 电话 号 码 短 每 页 的 第 一 项 准备 一 个 索引 ， 上 面 得 出 的 数字 会 减少 多 少 ? (这 条 索引 适合 
电话 号 码 敌 的 这 一 页 吗 ? ) 
c. 使 用 常见 的 方法 ( 非 正 式 的 ) 做 一 个 试验 ， 查 找 本 地 电话 号 籍 上 的 John Lewis， 把 这 个 数字 和 a 
中 的 数字 进行 比较 。 
11.4 试 解释 为 什么 一 个 文件 只 能 有 一 个 聚 缺 索引 。 
11.5 试 解释 为 什么 一 个 辅助 的 、 非 聚 答 索引 必须 是 稠密 的 。 
11.6 一 棵 B' 树 的 最 终结 构 取 决 干 添加 项 的 顺序 吗 ? 试 对 你 的 答案 作出 解释 ， 并 举 出 一 个 例子 。 
11.7 从 一 棵 每 个 节点 最 多 只 能 有 两 个 查找 键 的 空 B* 树 开始 ， 按 硕 序 插入 下 列 键 值 ， 看 树 是 如 何 增长 的 ? 
18,10,7,14,8,9,21 


11.8 思考 图 11-29 中 某 B* 树 的 一 部 分 。 
a. 不 添加 新 的 键 ， 把 所 有 内 部 节点 都 填充 上 。 
b. 增加 键 bbb， 说 明 树 的 变化 。 
c. 从 结果 b 中 删除 键 abc， 说 明 树 的 变化 。 





ne ns 


图 11-29 某 B" 树 的 一 部 分 


11.9 思考 图 11-30 的 B* 树 ， 假 设 它 是 从 其 他 树 插入 一 个 键 到 时 子 节点 后 ， 导 致 一 个 节点 的 分 裂 后 得 到 的 。 
树 原 来 是 什么 样子 ? 新 插入 的 键 是 什么 ?这 是 唯一 的 解决 办 法 吗 ? 试 对 你 的 答案 做 出 解释 。 





图 11-30 B+* 树 


11.10 为 一 棵 B" 树 描述 一 个 查找 算法 ， 其 中 的 查找 键 不 是 候选 键 。 假 设 在 处 理 相同 的 键 时 ， 没 有 使 用 溢 
出 页 。 

11.11 思考 一 个 散 列 函 数 h， 它 把 复合 查找 键 的 值 作为 参数 ， 复 合 查找 键 是 r 属 性 的 一 个 序列 ql, a2,… a,。 
如 果 h 有 下 面 的 形式 





11.12 
11.13 
11.14 
11.15 
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h(a, ° az ° +++ ° a,) = hy(a) ° h(a) © +++ oh(a,) 
这 里 hi 是 属性 a;: 上 的 一 个 散 列 ， 其 中 。 是 串 接 符 ，h 称 为 可 以 分 割 的 散 列 函 数 (partitioned hash 
function )。 对 等 值 查找 、 部 分 键 查找 和 范围 查找 ， 试 描述 这 样 一 个 散 列 函数 的 优点 。 
使 用 伪 代 码 写 出 一 棵 B' 树 的 插入 算法 。 
使 用 伪 代 码 写 出 一 棵 B* 树 的 删除 算法 。 
使 用 伪 代 码 写 出 可 扩展 散 列 模式 上 插入 和 删除 索引 项 的 算法 。 
试 给 出 下 列 例子 的 SQL 语句 ， 它 们 是 : 
a. 由 于 增加 B* 树 索引 ， 结 果 使 查找 速度 加 快 ( 如 图 11-21 所 示 )。 
b. 由 于 增加 B'* 树 索引 ， 结 果 使 查找 速度 降低 (如 图 11-21 所 示 )。 


11.16 对 图 11-21 的 索引 ， 试 画 出 插 人 alice、betty 、carol、debbie、edith 和 zelda 后 的 B+ 树 。 


11.17 


11.18 


11.19 


11.20 
11.21 
11.22 


11.23 


11.24 


关系 数据 库 中 的 一 个 表 包 含 100 000 行 ， 每 行 需要 200B 的 内 存 ， 一 条 SELECT 语 句 返 回 表 中 某 一 
属性 上 满足 等 值 查 找 的 所 有 行 。 试 估计 在 这 一 属性 上 建立 下 列 索 引 后 完成 这 一 查询 所 需 的 时 间 
(单位 为 ms)。 对 页 的 大 小 、 磁 盘 的 访问 时 间 等 作出 理想 的 估计 。 

a 没有 索引 ( 堆 文件 )。 

b. 一 个 静态 散 列 索 引 (没有 溢出 页 )。 

c. 一 个 豪 忽 的 、 非 集成 的 B* 树 索引 。 

对 上 题 中 的 表 ， 当 使 用 下 列 索 引 时 ， 试 估计 插入 一 行 的 时 间 (单位 为 ms): 

a 没有 索引 (文件 按 查找 键 排序 )。 

b. 一 个 静态 散 列 索 引 (没有 溢出 页 )。 

c. 一 个 育儿 的 、 非 集成 的 B' 树 索引 (不 需要 对 节点 分 裂 )。 

对 练习 11.17 中 的 表 ， 当 使 用 下 列 索 引 时 ， 试 估计 更 新 一 行 的 查找 键 值 所 需要 的 时 间 : 

a 没有 索引 (文件 按 查 找 键 排 序 )。 | 

b. 静态 散 列 索引 (区别 于 原来 行 所 在 的 页 ， 更 新 的 行 处 在 不 同 的 桶 中 ， 但 不 需要 溢出 页 )。 

c. B' 树 索引 (区别 于 原来 行 所 在 的 页 ， 更 新 的 行 处 在 不 同 的 页 中 ， 但 不 需要 分 裂 节点 )。 


试 估 计 存 储 练习 11.17 中 B* 树 所 需 的 空间 ， 并 将 它 和 存储 表 所 需 的 空间 进行 比较 。 

试 解 释 你 的 本 地 数据 库 管 理 系统 所 支持 的 索引 类 型 ， 并 给 出 创建 每 一 种 索引 的 命令 。 

试 为 学 生 注册 系统 的 表 设 计 索 引 ， 并 给 出 所 有 设计 决策 的 依据 (包括 那些 应 该 使 用 索引 但 没有 使 
用 索引 的 情况 )。 | 

在 下 列 情况 下 ， 试 解释 使 用 小 于 1 的 装填 因子 的 依据 : 

a. 有 序 文件 

b.ISAM 索 引 

c. BRS | 

d. 散 列 索引 

试 为 保持 递增 的 联结 索引 设计 一 个 算法 ， 也 就 是 说 ， 在 加 入 一 个 新 的 元 组 到 关系 中 时 ， 不 需要 从 


头 开始 重新 计算 整个 联结 索引 。 
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由 于 客户 已 经 认可 学 生 注 册 系 统 的 规格 说 明文 档 ， 所 以 可 以 继续 进行 这 个 项 目的 下 一 步 
工作 ， 即 设计 。 


12.1 设计 文档 


规格 说 明 描述 系统 应 该 是 什么 样子 ， 而 设计 描述 系统 如 何 实现 其 设计 的 功能 ， 因 而 设计 


一 个 事务 处 理 系统 会 包括 如 下 步骤 : 

。 系 统 使 用 的 全 局 数据 结构 的 声明 ， 包 括 数据 库 模 式 和 应 用 程序 在 事务 调用 之 间 保 存 的 数 

据 结构 。 

。 将 规格 说 明文 档 所 描述 的 每 个 交互 分 解 成 事务 和 过 程 。 

*。 详细 描述 系统 中 每 个 模块 、 对 象 、 过 程 和 事务 的 行为 。 

设计 阶段 的 结果 呈现 在 设计 文档 中 ， 从 某 种 意义 上 来 说 ， 它 是 规格 说 明文 档 的 延伸 。 规 
格 说 明文 档 详细 描述 了 系统 的 功能 ， 而 设计 文档 则 详细 描述 了 如 何 实现 这 些 功能 。 

设计 过 程 本 身 通常 被 视 为 是 项 目 实现 过 程 中 最 富有 创造 性 的 一 部 分 ， 好 的 设计 应 该 是 简 
单 而 优雅 的 。 设 计 人 员 阐明 和 评价 可 以 实现 所 需 功能 的 各 种 方案 (例如 ,各 种 各 样 表 的 设计 )， 
然后 根据 判断 和 经 验 做 出 决策 ， 这 些 决 策 将 极 大 地 影响 系统 的 实现 以 及 最 终 的 性 能 。 但 是 ， 
尽管 做 出 决策 是 件 愉快 的 事情 ， 但 是 在 设计 文档 中 详细 记录 却 是 设计 人 员 最 为 音调 乏味 的 任 
务 之 一 ， 然 而 这 个 过 程 是 必 不 可 少 的 。 

设计 文档 的 使 用 者 包括 : 

。 编 程 人 员 ， 他 们 把 设计 文档 作为 唯一 的 编程 信息 来 源 。 

。 质 量 控制 人 员 ， 他 们 借助 设计 文档 和 规格 说 明文 档 来 设计 测试 ， 并 在 发 现 错误 的 时 候 确 

定 是 哪里 出 了 问题 。 

。 维 护 人 员 ， 他 们 会 在 以 后 的 某 个 时 间 使 用 设计 文档 来 提升 系统 性 能 ， 

设计 过 程 中 的 一 个 重要 部 分 是 做 出 全 局 的 决策 ( 即 那些 会 影响 多 个 事务 和 过 程 的 决策 )， 
这 样 在 以 后 的 编程 阶段 ， 编 程 人 员 不 需要 知道 整个 系统 的 情况 (除了 那些 在 设计 文档 中 提供 
的 ) 就 可 以 实现 每 个 事务 和 过 程 。 如 果 设 计 文 档 不 完整 ， 但 某 个 事务 或 者 过 程 的 编程 人 员 根 
据 它 做 出 全 局 的 决策 ， 那 么 这 个 决策 很 可 能 会 与 另 一 个 事务 或 者 过 程 的 编程 人 员 对 同样 全 局 
问题 做 出 的 决策 不 一 致 ， 从 而 导致 错误 。 

假设 某 个 交互 I 被 分 解 成 两 个 事务 Ti 和 T2z， 事 务 T 读 取 数 据 库 项 X， 将 它 的 值 存 储 在 变量 x 
中 ， 对 于 I 来 说 x 是 全 局 的 。 当 提交 Ti 后 ，T: 被 初始 化 并 使 用 x 的 值 ， 但 是 X 的 值 可 能 已 经 被 并 
发 的 另 一 个 交互 更 新 了 。 如 果 Ts 仍 认定 x 是 X 的 当前 值 ， 那 么 执行 就 会 出 错 。 

在 设计 过 程 中 ， 必 须 做 出 全 局 决策 决定 是 否 允 许 T, 和 Ts 之 间 通 信 ， 或 者 是 否 需 要 将 T1 和 TT， 
放 在 同一 个 事务 中 。 假 定 执行 Ti 和 T: 之 间 不 可 能 改变 通信 的 值 ， 那 么 设计 者 或 许 会 允许 通信 。 
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例如 在 学 生 注册 系统 中 ，X 可 以 是 Semester Id， 虽 然 一 个 并 行 的 交互 可 能 改变 Semester Id, 但 
是 设计 人 员 认 为 这 种 情况 发 生 的 可 能 性 很 小 ， 所 以 可 以 使 用 这 样 的 方式 通信 。 这 个 决策 应 该 
记录 在 设计 文档 中 ， 以 便 每 个 程序 员 能 够 理解 ， 同 时 如 果 报 告 错误 并 发 现 假设 是 不 正确 的 ， 
那么 在 必要 的 时 候 就 应 该 进行 修改 。 


12.1.1 文档 结构 


一 个 事务 处 理 系统 的 设计 文档 包括 下 面 儿 个 部 分 : 

A. 标题 、 作 者 、 日 期 以 及 版 本 号 。 

B. 引言 简单 介绍 系统 的 目标 。 

C. 相关 文档 ”包括 对 需求 和 规格 说 明文 档 的 引用 ， 以 及 在 设计 或 者 实现 中 使 用 的 其 他 文 
档 ， 例 如 Visual Basic 用 户 手册 、ODBC 规 格 说 明文 档 或 者 设计 时 使 用 的 某 个 对 象 库 的 


规格 说 明文 档 。 
D. 高 级 设计 ”设计 的 非 正式 描述 ， 使 得 读者 能 很 容易 地 理解 后 面部 分 的 详细 说 明 。 有 关 
项 目 包 括 : 
1) 将 系统 分 解 成 模块 和 对 象 。 
2) 将 规格 说 明文 档 中 定义 的 交互 分 解 成 事务 和 过 程 。 
3) 过 程 调用 树 。 


4) 数据 库 设 计 的 E-R 图 ， 包 括 设 计 图 表 的 依据 。 

这 一 部 分 中 还 要 记录 设计 决策 的 依据 ， 例 如 : 

5) 为 什么 使 用 这 种 方法 将 会 话 分 解 成 事务 ， 而 不 使 用 另 一 种 也 许 更 直观 的 方式 ? 

6) 为 什么 表 要 使 用 这 种 方式 进行 规范 化 、 反 规范 化 或 者 分 片 s ， 以 满足 性 能 要 求 ? 

7) 为 什么 要 定义 某 些 索引 ? 

8) 为 什么 某 些 完整 性 约束 要 由 事务 进行 检查 ， 而 不 是 嵌入 在 数据 库 模 式 中 ? 

9) 为 什么 可 以 在 更 低 的 隔离 级 别 上 执行 事务 ? 

10) 其 他 的 以 便 达到 性 能 要 求 的 决策 。 

. 数据 库 模 式 和 其 他 全 局 数据 结构 的 声明 

1) 数据 库 模 式 
a. 一 组 完整 的 可 编译 语句 ， 用 来 声明 包括 表 、 索 引 、 域 名 规格 说 明 、 断 言 和 访问 权 
- 限 在 内 的 数据 库 模式 ， 要 记录 每 张 表 每 个 列 的 用 途 和 选择 每 个 索引 的 依据 。 
b. 完整 性 约束 列表 ， 并 描述 在 哪里 执行 约束 : 是 在 模式 中 执行 ， 还 是 在 单独 的 事务 
中 执行 。 

”2) 全 局 数据 结构 


ty 


其 他 任何 全 局 数据 结构 的 完整 可 编译 的 声明 ， 例 如 应 用 程序 保存 的 由 其 创建 的 事务 所 使 、 


用 的 数据 结构 。 必 须 记录 每 个 项 目的 用 途 及 其 值 的 限制 。 
F. 图 形 用 户 接口 ”如 果 在 项 目的 规格 说 明 阶段 已 经 使 用 应 用 生成 器 设计 和 实现 图 形 用 户 
接口 ， 并 且 在 规格 说 明 中 对 接口 进行 了 描述 ， 那 么 只 需要 引用 相应 的 文档 即 可 。 否 则 ， 任 何 


日 分 片 将 在 第 18 章 讨论 。 
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缺失 的 用 户 接口 细节 必须 在 这 里 提供 ， 包 括 所 有 事件 、 对 象 及 其 方法 的 规格 说 明 。 
G. 每 个 事务 和 过 程 的 详细 说 明 
1) 事务 或 者 过 程 名 称 。 
2) 描述 ”用 一 个 语句 非 正式 地 描述 事务 或 者 过 程 完成 什么 工作 ， 例 如 “这 个 事务 检查 这 
个 学 生 完 成 指定 课程 的 所 有 预备 课程 后 允许 其 注册 这 门 课程 ”， 描 述 的 目的 是 大 致 说 明 事 务 的 
用 途 ， 而 不 是 详细 说 明 它 的 功能 。 
3) 参数 事务 或 者 过 程 的 输入 、 输 出 参数 ， 记 录 每 个 参数 的 类 型 和 用 途 。 
4) 返回 值 事务 或 者 过 程 的 返回 值 ， 记 录 每 个 返回 值 的 类 型 和 用 途 。 
5) 调用 口 ”调用 事务 的 过 程 或 者 GUI 事件 ， 例 如 在 某 个 表单 对 象 上 点 击 鼠 标 时 会 调用 一 个 
事务 。 
6) 调用 “事务 所 调用 的 过 程 ， 包 括 它 引发 的 事件 和 产生 的 异常 。 这 两 项 在 需要 改变 设计 
和 代码 的 时 候 是 有 用 的 ， 设 计 人 员 和 编码 人 员 必 须 将 变化 传播 到 整个 设计 中 。 
7) 先决 条 件 事务 或 者 过 程 所 做 的 假设 〈 不 需要 在 运行 的 时 候 检 查 ) ， 包 括 数据 库 的 状态 、 
全 局 的 数据 结构 以 及 它 运行 时 的 参数 。 例 如 ， 学 生 注 册 课程 的 事务 可 以 假设 先前 执行 的 事务 
已 经 对 这 名 学 生 进 行 了 认证 。 再 比如 ， 鼠 标点 击 事件 调用 的 过 程 可 以 假定 所 需 的 输入 参数 已 
经 被 用 户 存储 在 某 个 表单 对 象 的 特定 字段 中 。 在 大 型 系统 实现 中 ， 大 部 分 全 局 错误 出 现 的 原 
因 在 于 对 先决 条 件 理 解 不 同 。 
8) 隔离 级 别 执行 事务 所 处 的 隔离 级 别 。 
9) 动作 
a. 对 事务 或 者 过 程 所 采取 的 动作 的 文字 描述 ， 这 有 段 描述 可 能 有 一 两 段 而 不 是 象 先前 那样 
只 有 一 名 话 ， 目 的 是 帮助 程序 员 编 写 代 码 。 
b. 所 访问 的 数据 库 表 和 全 局 数据 结构 ， 以 及 事务 和 过 程 假定 会 发 生 的 变化 。 例 如 ， 在 一 
个 注册 事务 成 功 完成 之 后 ， 学 生 一 定 会 出 现在 相应 的 注册 课程 的 表 中 ， 同 时 这 门 课程 
的 注册 人 数 也 一 定 会 增加 。 
c. 错误 情形 
。 正 确 性 检查 ， 事 务 或 者 过 程 必须 保证 参数 、 全 局 数据 结构 或 者 数据 库 的 正确 性 。 例 如 ， 
要 求学 生 注 册 课程 事务 检查 学 生 已 经 完成 (或 者 正在 进行 ) 该 课程 所 有 预备 课程 。 一 个 
访问 允许 空 的 字段 的 事务 (例如 注册 事务 读 课程 的 天 数 和 时 间 ) 在 执行 的 时 候 要 检查 该 
字段 是 否 为 空 。 必 须 描述 当 检 查 失败 的 时 候 所 采取 的 动作 。 
。 事 务 更 新 时 系统 将 要 做 的 自动 约束 检查 ， 以 及 更 新 失败 时 应 采取 的 动作 。 
。 其 他 任何 可 能 发 生 的 错误 和 异常 情况 以 及 这 些 情况 下 所 采取 的 动作 。 例如 ， 当 数据 库 
CONNECT 语 句 失 败 时 会 发 生 什 么 ? 什么 情况 下 会 抛 出 异常 ， 是 什么 样 的 异常 ? 
d. 各 种 情形 下 显示 的 表单 ， 例 如 在 成 功 完成 的 情形 下 或 者 发 生 指定 错误 情形 下 应 显示 的 
表单 。 - 


12.1.2 设计 评审 


在 设计 的 最 后 阶段 ， 通 常会 举行 正式 的 设计 评审 (design review)， 所 有 的 设计 和 质量 保 
证 人 员 将 参加 这 一 活动 ， 可 能 还 包括 一 些 其 他 人 员 。 参 加 的 人 员 在 评审 前 会 得 到 最 新 的 规格 
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TASHA KH, BRERA ZA CAKE. 

设计 人 员 做 正式 陈述 ， 要 求 与 会 人 员 能 理解 设计 并 找 出 以 下 几 个 方面 存在 的 问题 : 

“设计 文档 和 规格 说 明文 档 不 一 致 的 地 方 。 

“设计 文档 不 正确 、 不 一 致 、 不 完整 或 者 模糊 不 清 的 地 方 。 

。 可 以 提高 设计 效率 的 地 方 ( 也 许 是 使 用 不 同 的 表 结 构 或 者 索引 结构 就 可 以 实现 )。 

* 项目 达到 目标 所 冒 的 风险 。 例 如 某 个 搜索 算法 满足 响应 时 间 要 求 吗 ? 设计 需要 那些 无 法 

及 时 获得 而 影响 进度 的 新 版 的 数据 库 驱 动 程序 吗 ? 存在 一 些 不 可 靠 的 假设 作为 全 局 决策 

的 基础 吗 ? 

设计 评审 的 目的 在 于 找 出 问题 而 不 是 解决 问题 ， 找 出 的 每 个 问题 会 被 分 配给 设计 组 的 某 
个 成 员 ， 要 求 他 在 指定 时 间 内 解决 ， 并 添加 到 设计 文档 的 以 后 版 本 中 。 

在 设计 评审 时 发 现 的 错误 比 在 以 后 编程 和 测试 时 发 现 的 错 更 容易 修改 ， 而 且 代价 也 更 小 。 
在 将 系统 交付 给 客户 以 后 才 发 现 问题 ， 这 时 更 改 的 代价 将 会 更 大 。 

设计 评审 会 议 可 能 会 包括 测试 计划 (test plan) 的 评审 ， 下 一 节 将 讨论 这 个 问题 。 


12.2 测试 计划 


测试 是 所 有 软件 工程 项 目 中 重要 的 一 部 分 ， 而 不 是 测试 人 员 在 编程 完成 以 后 才 开 始 考虑 
的 一 种 非 正 式 的 特殊 行为 。 测 试 要 按照 正式 的 测试 计划 文档 来 进行 ， 这 个 文档 是 在 项 目的 设 
计 和 编程 阶段 准备 的 。 测 试 计划 文档 规定 所 要 执行 的 测试 、 所 使 用 的 测试 数据 以 及 对 执行 测 
试 所 需 的 测试 驱动 程序 和 脚本 软件 的 设计 。 . 

完整 的 测试 计划 包括 模块 测试 (module test) ， 是 由 每 个 模块 的 编程 人 员 在 提交 模块 进行 
系统 整合 前 进行 的 测试 ; 集成 测试 integration test) ， 是 由 将 模块 整合 到 系统 的 人 员 负 责 的 测 
试 ， 以 及 QA 测试 集 (QA test set)， 是 由 质量 保证 人 员 在 完成 整合 的 系统 上 进行 的 测试 。 

本 节 将 重点 介绍 最 终 的 QA 测 试 集 ， 但 在 讨论 之 前 先 注意 模块 测试 的 一 个 重要 方面 ， 即 模 
块 中 每 个 SQL 语句 的 测试 。 这 些 测 试 包 括 代码 检查 (code check)， 由 相关 人 员 检 查 每 个 SQL 
语句 并 确认 符合 英语 语言 规范 ， 此 外 还 包括 常规 的 测试 ， 即 在 实际 或 者 测试 数据 库 上 执行 
SQL 语句 。 

为 商业 事务 处 理 系统 设计 合适 的 QA 测 试 集 是 件 非常 辛苦 的 事情 。 测 试 集中 的 测试 用 例 可 
以 用 下 面 两 种 方法 进行 测试 。 

RARI (black box test) 是 使 用 规格 说 明文 档 设计 出 来 的 ， 而 不 需要 查看 设计 文档 和 代 
码 。 这 种 测试 假设 系统 是 一 个 看 不 到 内 部 结构 的 “ 黑 盒 子 ” ， 目 标 是 确认 系统 符合 规格 说 明 。 
因此 规格 说 明文 档 中 的 每 一 个 规格 说 明 (包括 错误 情形 ) 至 少 有 一 个 测试 用 例 相对 应 ， 一 些 
规格 说 明 可 能 有 好 几 个 测试 用 例 。 例 如 ， 为 了 测试 注册 某 门 课程 的 学 生 数 没有 超过 规定 的 最 
大 数目 ， 测 试 人 员 必 须 测 试 注册 的 学 生 数 比 最 大 数目 少 1 和 正好 等 于 最 大 数目 的 时 候 执行 注册 
事务 的 情况 。 测 试用 例 也 应 该 包括 数目 远 小 于 最 大 数目 的 情况 。 如 果 最 大 数目 指定 为 0 或 者 1， 
会 发 生 什 么 情况 ?由 于 在 整数 范围 内 测试 所 有 可 能 的 已 经 注册 学 生 数 和 最 大 数目 是 不 实际 的 
(这 是 一 个 完全 的 穷 举 测 试 集 )， 因 此 设计 人 员 必 须根 据 经 验 设 计 测试 集 ， 它 能 够 代表 可 能 发 
生 的 情形 ,满足 适当 的 边界 条 件 ， 并 且 能 在 规定 的 测试 时 间 内 完成 。 

因为 在 规格 说 明文 档 中 指定 了 用 户 接口 ， 因 此 黑 盒 测试 必须 测试 用 户 接口 。 
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AAAH (glass box test) ERRi LEKAR it. SRL “AS”, BAA 
以 看 到 系统 内 部 结构 ， 目 的 在 于 确认 编程 的 细节 是 正确 的 。 因 此 ， 白 盒 测 试 应 当 访 问 每 一 行 
代码 ， 遍 历 每 一 个 分 支 ， 检 查 每 个 循环 的 边界 条 件 ， 调 用 每 个 事件 ， 执 行 每 个 完整 性 检查 ， 
测试 每 个 算法 的 方方面面 。 例 如 ， 检 查 学 生 是 否 完成 某 门 课程 的 所 有 预备 课程 的 代码 包含 一 
个 while 循 环 ， 测 试 设计 人 员 应 当 测 试 循环 的 退出 条 件 是 正确 的 。 注 意 ，while 循 环 的 存在 条 件 
以 及 退出 条 件 在 规格 说 明文 档 中 并 没有 特别 指出 ， 这 就 是 为 什么 除了 黑 盒 测试 之 外 还 需要 和 白 
盒 测 试 。 不 过 黑 盒 测试 也 是 必要 的 ， 因 为 设计 人 员 可 能 会 对 规格 说 明文 档 中 的 某 些 部 分 理解 
有 误 ， 而 基于 设计 文档 的 测试 集 不 会 发 现 这 些 错 误 。 例 如 ， 白 盒 测 试 显示 while 循 环 的 退出 条 
件 是 符合 设计 文档 的 ， 但 是 设计 文档 没有 正确 地 解释 规格 说 明 。 

测试 计划 可 能 还 包括 压力 测试 (stress test)， 即 将 系统 置 于 模拟 的 或 者 真实 的 情况 下 确认 
它 满足 事务 通过 量 和 响应 时 间 的 规格 说 明 。 这 类 测试 可 以 显示 大 量 死 锁 发 生 的 情形 ， 以 及 因 
某 些 原因 需要 调整 数据 库 设计 来 增加 通过 量 和 减少 响应 时 间 的 情形 。 

如 果 程 序 是 建立 在 保证 ACID 性 质 的 系统 上 ， 并 且 假 设 已 经 单独 测试 过 每 个 事务 BAR 
不 需要 测试 事务 是 否 能 正确 地 并 发 执行 。 但 是 如 果 程 序 是 在 低 于 SERIALIZABLE ( 见 10.2.3 
节 ) 的 隔离 性 级 别 上 执行 ， 就 需要 测试 在 并 发 执行 的 情况 下 是 否 正确 。 

在 测试 计划 中 经 常 被 忽略 的 是 测试 用 户 手 册 或 者 其 他 交付 文档 ， 确 保 它 们 与 规格 说 明和 
交付 的 系统 一 致 。 

测试 计划 文档 包括 所 有 要 执 和 的 测试 的 脚本 和 相应 的 正确 结果 。 因 为 测试 计划 包括 大 量 
的 测试 并 且 在 测试 和 维护 阶段 (修改 一 些 错 误 和 增加 一 些 新 的 功能 之 后 ) 需要 运行 多 次 ， 因 
此 使 用 测试 驱动 程序 或 者 脚本 机 制 来 自动 执行 测试 计划 是 十 分 必要 的 。 如 果 使 用 了 这 样 的 机 
制 ， 那么 测试 计划 文档 需要 包括 油 试 驱动 程序 的 相应 输入 。 如 果 测 试 驱动 程序 是 作为 项 目的 
一 部 分 实现 的 ， 那 么 也 必须 包括 它 的 设计 。 

测试 计划 文档 需要 包含 测试 人 员 执 行 测试 时 使 用 的 测试 协议 (或 者 是 引用 公司 的 标准 测 
试 协议 文档 ) 的 描述 。 协 议 应 当 包 括 在 发 现 错误 的 时 候 必 须 填写 的 错误 报告 表单 (error 
report fortn )。 错 误 报 告 包括 测 试 人 员 的 名 字 、 测 试 日 期 以 及 错误 描述 ， 最 重要 的 是 对 如 何 再 
现 错误 的 描述 。 错 误 报 表 被 发 送 给 负责 修复 错误 的 人 员 ， 由 他 填写 什么 时 候 ， 如 何 修复 错误 
以 及 在 哪 一 个 版 本 中 包含 修复 版 本 的 信息 。 整 个 协议 必须 确保 所 有 发 现 的 错误 最 终 被 修复 并 
且 在 某 一 版 本 的 代码 中 包括 这 些 修复 。 l 

设计 一 个 全 面 的 而 且 便于 管理 的 测试 文档 需要 相当 多 的 技巧 和 经 验 。 对 任何 一 个 软件 而 言 ， 
测试 集 的 实际 大 小 和 测试 的 范围 通常 是 市 场 和 技术 上 的 决策 ， 有 时 依赖 于 相互 矛盾 的 因素 ， 例 如 : 

。 系 统 的 正确 性 重要 到 何 种 程度 ? 人 们 生活 在 危险 之 申 吗 ? 

“时 间 对 系统 所 在 的 市 场 重要 到 何 种 程度 ? 竞争 对 手 的 产品 将 要 发 布 吗 ?” 或 者 系统 必须 在 

即将 到 来 的 展览 会 上 展 出 吗 ? 

在 某 些 重 要 的 应 用 中 ， 差 不 多 有 一 半 的 时 间 是 花费 在 项 目的 测试 上 。 当 管理 层 施加 压力 要 求 
发 布 未 经 完全 测试 的 产品 时 ， 有 时 候 也 会 产生 职业 道德 问题 。 

在 应 用 中 ,一 个 小 组 实现 系统 并 将 它 交付 给 另 一 个 小 组 ， 由 后 者 负责 运行 和 维护 ， 这 时 
测试 集 、 嵌 动 程序 或 者 脚本 机 制 是 与 代码 和 文档 一 起 作为 可 交付 产品 的 一 一 部 分 。 

接受 测试 和 beta 测 试 i 

测试 计划 是 由 系统 实现 人 员 准 备 和 执行 的 ， 而 客户 通常 在 接受 系统 之 前 要 准备 和 执行 接 
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受 测 试 (acceptance test) 。 接 受 测 试 通常 由 实际 输入 和 客户 的 数据 库 组 成 (实现 人 员 的 测试 计 
划 通 常 涉及 边界 测试 用 例 的 输入 和 测试 数据 库 )， 它 可 以 增强 客户 对 系统 实现 目标 的 信心 ,一 
个 精明 的 客户 会 花费 相当 多 的 精力 去 设计 接受 测试 ， 这 个 测试 可 以 全 面 测试 在 真实 情况 下 系 
统 的 运行 情况 。 

如 果 系 统 是 一 个 有 许多 客户 的 产品 ， 那 么 可 以 选择 其 中 的 一 些 客户 进行 beta 测 试 (beta 
test) ， 先 前 由 实现 人 员 进 行 的 测试 称 作 alpha 测 试 (alpha test)。 当 alpha 测 试 完成 时 ， 会 将 
beta 测 试 版 (beta test version) 提供 给 客户 ， 他 们 在 实际 应 用 中 使 用 这 个 版 本 并 将 错误 报告 给 
实现 人 员 。 虽 然 beta 测 试 版 仍 可 能 包含 严重 的 错误 ， 客 户 需 要 谨慎 使 用 (实现 人 员 已 经 将 
alpha 测 试 量 最 小 化 ， 依 赖 beta 测 试 来 发 现 系 统 中 的 错误 )， 但 是 客户 可 以 从 早期 的 版 本 中 受益 
并 且 一 些 经 济 上 或 者 技术 上 的 因素 也 会 激发 客户 进行 beta 测 试 的 兴趣 。beta 测 试 需要 持续 一 段 
时 间 ， 之 后 系统 的 最 初 发 布 版 会 提供 给 所 有 的 客户 。 

即使 经 过 所 有 的 测试 ， 一 些 重 要 应 用 的 客户 通常 仍 会 将 新 的 系统 和 已 有 的 系统 一 起 运行 
一 段 时 间 ， 直 到 能 确认 它 可 以 正确 可 靠 地 执行 任务 为 止 。 


12.3 项 目 计划 


项 目 计划 是 软件 工程 的 另 一 个 重要 组 成 部 分 。 在 准备 规格 说 明文 档 的 时 候 ， 项 目 经 理会 
给 出 项 目 计划 的 初始 版 本 。 为 了 制定 项 目 计划 ， 经 理 将 项 目 分 解 成 一 组 任务 (task)， 估 计 完 
成 每 项 任务 所 需 的 时 间 ， 然 后 将 它们 安排 给 个 人 或 者 小 组 (并 告 之 预计 的 开始 和 结束 日 期 )。 

任务 可 以 包括 设计 、 编 码 、 测 试 和 制作 文档 ， 而 完成 这 个 属性 必须 准确 地 予以 描述 ， 例 
如 可 以 说 “模块 3 的 编码 已 经 完成 "， 但 不 能 说 “模块 4 已 经 有 90% 调 试 过 ”。 估 计 完 成 一 项 任 
务 的 时 间 是 十 分 困难 的 ， 因 为 要 理解 任务 的 复杂 性 和 负责 实现 这 项 任务 的 人 员 的 能 力 。 

安排 任务 的 一 个 很 重要 的 方面 是 任务 依赖 性 (task dependency)， 即 某 些 任务 要 在 其 他 任 
， 务 完成 以 后 方 能 进行 。 例 如 ， 模 块 的 测试 不 可 能 在 还 没 编程 就 开始 。 

根据 依赖 性 和 估计 的 任务 持续 时 间 可 以 生成 依赖 图 (dependency chart), ， 也 叫做 PERT 图 
(Program Evaluation and Review Technique )， 见 图 12-1。 和 矩形 代表 活动 ， 上 方 标识 的 是 持续 
时 间 (有 了 时 还 包括 估计 的 任务 持续 的 最 长 和 最 短 时 间 )， 弧 线 代 表 依赖 关系 。 使 用 这 种 方式 ， 





图 12-1 依赖 图 
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可 以 表示 哪些 任务 可 以 并 行 执行 ， 而 哪些 任务 必须 依次 执行 。 从 起 点 到 终点 最 长 的 一 条 路 径 
称 作 关 键 路 径 (critical path), ， 是 估计 完成 项 目 所 需 的 最 短 时 间 。 
记录 项 目 计划 的 其 他 图 包括 : 
“活动 图 (activity chart) ， 也 称 作 甘 特 图 (Gantt chart), ， 这 个 名 称 是 以 发 明 它 的 人 Henry 
Gantt 命 名 的 。 它 是 一 个 表示 任务 什么 时 候 开 始 和 什么 时 候 结束 的 条 形 图 ( 见 图 12-2)。 























0 天 5 天 10 天 ISK ”20 天 25 天 30 天 
任务 1 
任务 2 
任务 3 | 
任务 4 | | 
任务 5 
任务 6 
任务 7 结束 

图 12-2 活动 图 


。 人 员 安 排 图 (staff allocation chart)， 表 示 将 某 项 任务 安排 给 某 人 以 及 计划 的 起 始 和 终止 
时 间 的 条 形 图 ( 见 图 12-3 )。 








图 12-3 人 员 安排 图 


在 项 目 进行 的 过 程 中 ， 项 目 经 理 将 定期 召开 项 目 会 议 (可 能 是 每 周一 次 )， 会 上 每 个 实现 
小 组 成 员 报告 所 负责 任务 的 状态 和 预期 结束 时 间 ， 并 与 项 目 计划 规定 的 完成 时 间 相 比较 。 项 
目 经 理应 当 创 造 轻松 的 气氛 使 小 组 成 员 在 对 所 分 配 的 任务 感到 困难 而 难以 在 规定 时 间 内 完成 
时 能 够 坦诚 地 提出 来 。 如 果 有 必要 ， 项 目 经 理 需要 做 出 适当 的 决策 以 保证 项 目 按时 完成 。 要 
特别 关注 关键 路 径 上 的 任务 ， 通 常 最 好 的 人 员 都 被 安排 完成 这 些 任务 。 在 会 议 上 记录 所 做 出 
的 决策 和 任务 安排 是 十 分 重要 的 。 

当 项 目 完成 的 时 候 ， 许 多 项 目 经 理会 举行 总 结 会 议 ， 整 个 小 组 一 起 讨论 在 项 目 计划 和 其 
他 方面 的 经 验 和 教训 。 目 的 在 于 从 错误 中 吸取 教训 ， 并 提高 经 理 和 小 组 成 员 软件 工程 的 能 力 。 
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尽管 项 目 管理 软件 可 以 自动 生成 项 目 计 划 图 ， 但 是 准备 和 监督 项 目 计划 需要 丰富 技巧 和 
经 验 。 实 际 上 ， 许 多 软件 项 目 失 败 或 者 延迟 的 主要 原因 在 于 项 目 经 理 缺 乏 项 目 计 划 和 监督 的 
能 力 。 


12.4 编程 


在 大 部 分 软件 项 目 中 ， 编 程 花 费 的 时 间 少 于 整个 项 目 完成 时 间 的 六 分 之 一 。 当 应 用 生成 
器 和 可 重用 对 象 包 能 够 自动 地 从 设计 生成 代码 的 时 候 ， 所 花费 的 时 间 将 更 少 。 

一 个 运作 良好 的 IT 部 门 应 当 有 每 个 程序 员 都 遵守 的 编程 指导 。 这 些 指导 每 个 公司 都 不 相 
同 ， 但 是 很 多 规则 是 通用 的 。 一 些 编程 语言 (如 Java) 有 它 自己 的 编程 风格 ， 但 是 这 通常 仅 
仅 是 典型 编程 标准 要 求 的 一 小 部 分 。 一 个 众所周知 的 例子 是 GNU 编 程 指导 [Stallman2000]。 在 

里 给 出 几 个 生成 具有 专业 质量 代码 的 建议 : 

。 编 程 最 重要 的 两 点 是 正确 (correctness) 和 清楚 (clarity) 9 。 除 了 正确 之 外 ， 代 码 必 须 

能 被 很 多 人 所 理解 (例如 质量 保证 和 维护 组 的 人 员 )， 他 们 将 在 项 目的 整个 生命 周期 里 

阅读 它 。 

* 所 有 的 程序 员 应 当 使 用 相同 的 变量 定义 和 缩 进 风 格 等 等 。 好 的 文本 编辑 器 和 集成 开发 系 

统 会 提供 根据 规则 自动 缩 进 排版 程序 的 工具 ， 整个 系统 的 程序 应 当 看 起 来 似乎 是 一 个 程 

序 员 编写 的 。 

。 变 量 和 过 程 应 当 有 面向 应 用 的 名 称 ， 能 够 从 它 的 名 称 知道 用 途 ， 例如 不 要 使 用 S 或 者 Stu 

甚至 Student， 而 要 使 用 Student_Name 或 者 Student_ID_Number。 

。 注 释 的 使 用 。 

。 每 个 模块 、 过 程 和 事务 的 代码 都 应 当 首先 有 导言 (preamble )， 它 与 设计 文档 中 的 详 
细 描 述 相同 ， 可 以 包括 作者 、 日 期 和 修订 编号 。 有 的 指导 要 求 在 程序 文件 中 包括 修订 
历史 (revision history) 记录 ， 例 如 : 


1999-12-12: Mary Doe (md@company.com) 
foo.java (checkAll1): added capability to check userids 
1998-03-22: John Public (jp@company.com) 
foo.java (checkCredentials): fixed bug in while loop 
不 过 在 程序 文件 中 保留 修订 历史 显得 过 时 了， 因为 已 经 开发 出 成 熟 的 版 本 控制 系统 ， 而 且 
软件 工程 的 复杂 性 一 直 在 增加 。 一 个 比较 好 的 方法 是 将 相同 目录 下 的 所 有 文件 的 修订 历史 保 
存在 一 个 单独 的 文件 里 ， 这 个 文件 通常 叫做 ChangeLog ， 这 样 开 发 人 员 可 以 在 一 个 地 方 看 到 对 
所 有 文件 的 修改 ， 并 且 按 照 时 间 上 顺序 排序 。 当 相同 目录 下 的 程序 文件 相互 依赖 的 时 候 ， 这 种 
方式 更 具 优越 性 。 单 独 文件 的 历史 可 以 从 版 本 控制 系统 中 获得 ， 这 比 放 在 程序 文件 里 要 好 。 
* 模块、 过 程 和 事务 中 的 注释 应 当 是 面向 应 用 的 。 例 如 ， 下 面 的 注释 就 是 没有 意义 的 : 


/* Increment number_registered */ 
number_registered = number_registered+1; 


因为 可 以 从 代码 看 出 注释 的 含义 。 如 果 这 行 代码 是 注册 事务 中 的 一 部 分 ， 并 需要 记录 下 来 ， 
那么 更 好 的 注释 是 : 


© 第 三 个 c 是 指 聪明 (cleverness )， 重 要 性 最 低 。 
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/* Another student has registered */ 

不 是 所 有 的 语句 都 需要 注释 ， 一 些 关于 编程 风格 的 书 建议 给 所 有 的 循环 和 条 件 语句 添加 
注释 。 例 如 ， 可 以 为 循环 和 条 件 语句 分 别 添 加 以 下 注释 : 

F * Give all employees making < $10,000 a 5% raise. */ 


和 


/* If the customer has exceeded the credit limit, 
** then abort transaction. */ 


“ 当 因 修复 bug 和 扩展 系统 而 需要 修改 代码 的 时 候 ， 相 应 的 注释 也 要 同时 更 新 。 
“清楚 地 记录 系统 相关 的 数据 结构 和 代码 。 例 如 一 些 厂 商 提 供 它 们 自己 的 傣 入 式 SQL 
CONNECT 语 句 : 


EXEC SQL CONNECT student_database IDENTIFIED BY pml 
DBMS_PASSWORD = 'z9t.56'; 
/* *xSystem Specific: Ingres version of CONNECT */ 


如 果 在 将 来 系统 要 移植 到 另 一 个 DBMS ， 通 过 文本 编辑 器 能 够 很 容易 地 发 现 与 系统 相关 的 
语句 。 如 果 CONNECT 语 句 在 系统 中 出 现 多 次 ， 那 么 可 以 将 它 封装 在 一 个 过 程 中 ,在 适当 的 地 
方 调用 这 个 过 程 即 可 。 这 样 ， 当 系统 需要 移植 的 时 候 ， 只 要 对 这 个 函数 进行 修改 就 可 以 了 。 

原型 编程 o 

到 目前 为 止 ， 项 目的 编程 阶段 和 需求 分 析 以 及 设计 阶段 是 完全 区 分 开 来 的 。 但 是 实际 上 ， 
为 帮助 制定 决策 ， 通 常 在 早期 阶段 就 实现 系统 的 部 分 原型 。 例 如 ， 在 事务 处 理 系统 中 实现 下 
面 的 原型 可 能 是 必要 的 : 

需求 分 析 阶 段 

“用 户 接口 的 原型 ， 用 来 评价 接口 的 清晰 度 和 可 用 性 ， 并 合并 客户 的 反馈 。 

“访问 DBMS 代 码 的 原型 ， 用 来 比较 不 同 设计 方案 的 速度 ， 例 如 存储 过 程 和 让 入 在 应 用 程 

序 中 的 过 程 相 比较 。 通 过 这 些 试 验 可 以 确认 最 终 系统 的 预期 事务 吞吐 量 ， 或 者 在 编程 和 

测试 阶段 评价 (减少 ) 执行 这 些 任务 所 需 的 时 间 。 


设计 阶段 
“ 一 张 表 的 不 同 设计 原型 ， 用 来 评价 不 同 的 索引 模式 执行 某 个 SELECT 或 者 UPDATE 语 名 
所 需 的 时 间 。 


* 设计 的 其 他 部 分 的 原型 ， 用 来 评价 或 者 减少 某 个 设计 决策 带 来 的 风险 。 
有 时 原型 代码 最 终 会 丢弃 ， 但 也 有 可 能 使 用 在 最 终 的 产品 中 。 


12.5 渐进 式 开发 


许多 大 型 项 目 往 往 需要 几 年 的 时 间 才 能 完成 ， 在 这 段 时 间 ， 资 助 项 目的 企业 的 需求 和 目 
标 可 能 会 发 生 很 大 的 变化 ， 因 此 在 项 目 过程 中 ， 企 业经 理 也 许 会 要 求 对 正在 构建 的 系统 的 规 
格 说 明 进行 大 的 修改 。 一 个 重要 问题 是 实现 小 组 如 何 对 这 样 的 要 求 做 出 响应 。 

一 种 方法 是 按照 原来 的 要 求 继续 构建 系统 。 不 过 即使 项 目 成 功 地 完成 ， 最 终 的 系统 可 能 
也 无 法 完全 符合 企业 的 要 求 。 当然， 系统 的 下 一 个 版 本 会 包括 部 分 或 者 所 有 要 求 的 变化 ， 并 
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且 新 的 版 本 可 以 在 第 一 个 版 本 完成 后 立即 开始 ， 并 且 有 望 在 相对 较 短 的 时 间 里 完成 。 

另 一 个 方法 是 严格 按照 经 理 的 要 求 ， 在 项 目 过 程 中 多 次 修改 规格 说 明 、 设 计 和 代码 。 遗 
憾 的 是 ， 这 样 永 远 也 不 能 成 功 地 完成 项 目 ， 因 为 设计 始终 在 修改 ， 代 码 始 终 在 重 写 ， 项 目 完 
成 时 间 一 拖 再 拖 ， 而 且 需 要 越 来 越 多 的 钱 维持 项 目的 进行 ， 直 到 最 后 取消 项 目 。 根 据 Standish 
Group 的 报告 ，31% 的 信息 系统 项 目 在 完成 之 前 就 取消 了 。 要 想 成 功 地 使 用 这 种 方法 ， 需 要 限 
制 修改 的 次 数 和 范围 ， 还 需要 协商 预算 的 增加 和 时 间 的 延长 。 

还 有 一 种 方法 称 作 渐进 式 开发 (incremental development) ， 该 方法 一 步 步 地 构建 系统 。 
首先 在 部 分 初始 规格 说 明 的 基础 上 建立 系统 的 核心 版 本 (core version)， 这 项 工作 可 以 在 短 时 
间 内 实现 。 接 着 开发 下 面 的 版 本 ， 基 于 企业 需求 的 改变 和 从 运行 先前 版 本 中 获得 的 经 验 ， 每 
个 版 本 会 包括 更 多 的 功能 和 一 些 经 理 要 求 的 变化 。 经 过 几 次 渐进 式 开发 后 ， 系 统 包括 了 大 部 
分 的 需求 。 当 然 它 永 远 也 不 可 能 包含 所 有 的 需求 ， 因 为 经 理会 不 断 修改 它们 。 

渐进 式 开发 通常 优 于 其 他 两 种 方法 。 因 为 可 以 在 相对 较 短 的 时 间 内 得 到 一 个 可 运作 的 系 
统 ， 所 以 风险 被 降低 到 最 小 ， 同 时 可 以 基于 实际 运行 的 经 验 来 扩展 系统 。 一 个 潜在 的 缺点 是 
需要 仔细 设计 初始 版 本 ， 否 则 早期 版 本 的 设计 决策 也 许 会 导致 在 以 后 不 太 适合 增加 新 的 功能 。 
那 时 设计 者 可 以 选择 改变 设计 ( 重 写 大 部 分 代码 ) 或 者 使 用 旧 的 版 本 ， 这 有 可 能 使 系统 效率 
不 高 。 

然而 ， 有 些 设计 人 员 把 渐进 式 开发 当 作 不 做 任何 设计 的 借口 ， 只 在 前 一 版 本 上 随意 删改 ， 
这 种 方式 无 疑 会 导致 灾难 性 的 后 果 。 l 


12.6 学 生 注 册 系 统 的 设计 和 编程 


5.7 节 讨论 表 的 设计 和 一 些 简单 的 适合 学 生 注册 系统 的 约束 ， 本 节 将 完成 设计 并 提供 更 复 
杂 约 束 的 细节 和 注册 事务 的 部 分 代码 。 


12.6.1 完成 数据 库 设计 : 完整 性 约束 


数据 库 设 计 的 一 个 重要 部 分 是 列 出 数据 库 完 整 性 约束 并 决定 怎样 检查 约束 : 是 由 DBMS 
(在 CREATE TABLE, CREATE ASSERTION 或 者 CREATE TRIGGER 语 句 中 ) 自动 检查 还 是 
在 一 个 或 者 多 个 事务 中 检查 。 在 5.7 节 数据 库 的 初始 设计 中 并 没有 完全 讨论 约束 ， 是 因为 还 设 
有 介绍 一 些 所 需 的 SQL 结构 。 

下 面 列 出 数据 库 完 整 性 约束 ， 并 给 出 在 哪里 实施 约束 : 在 模式 中 ( 见 图 $-15、 图 5-16 和 图 
12-4) 还 是 在 独立 的 事务 中 。 它 们 与 3.2 节 需求 文档 中 给 出 的 约束 一 致 ， 只 是 对 它们 加 以 扩充 
指定 每 个 约束 涉及 的 属性 和 表 。 

。Id 唯 一 性 。STUDENT 表 中 的 1d，FAcULTY 表 中 的 Id 和 CovurRsE 表 中 的 CrsCode 都 必须 是 唯一 

的 ， 这 由 相应 表 中 的 主键 约束 执行 ， 见 5.7 节 。 

。 如 果 学 生 在 某 年 /学 期 注册 了 一 门 课 程 ， 那 么 学 校 必 须 在 该 年 /学 期 必须 提供 这 门 课 程 。 

如 果 在 TRANSCRIPT 表 中 存在 具有 某 个 CrsCode、Semester 和 Year 的 一 行 ， 那 么 也 必须 在 

CLASS 表 有 一 行 与 其 对 应 。 这 是 由 注册 事务 Register0 执 行 的 ， 见 12.6.3 节 。 

。 注 册 限 制 性 。CLASS 表 中 ， 属 性 Enarollment 的 值 不 能 大 于 同一 行 属 性 MaxEnrollment 的 值 。 

这 由 CLAss 表 的 CHECK 约 束 执行 。 
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CREATE ASSERTION RoOoMADEQUACY 
CHECK ( NOTEXISTS (SELECT * 
FROM CLASS C, CLASSROOM R 
WHERE C.MaxEnrollment > R.Seats 
AND C.ClassroomId = R.ClassroomId ) ) 


CREATE ASSERTION ENROLLMENTCONSISTENCY 
CHECK ( g 
NOT EXISTS (SELECT * 
FROM CLASS C 
WHERE C.Year = EXTRACT(YEAR FROM CURRENT_DATE) 
-- current_semester() isa user-defined function 
AND C.Semester = current_semester() 
AND C.Enrollment <> 
(SELECT COUNT( * ) 
FROM TRANSCRIPT T 
WHERE T.CrsCode = C.CrsCode 
AND T.Year = C.Year 
AND T.Semester = C.Semester) 


CREATE TRIGGER CANTCHANGEGRADETOI 
AFTER UPDATE OF Grade ON TRANSCRIPT 
REFERENCING OLDAS 0 


. NEW AS N 

FOR EACH ROW 

WHEN (0.Grade IN ('A','B','C','D','F') AND N.Grade = 'I') 
ROLLBACK 





图 12-4 学 生 注册 系统 的 部 分 约束 


。 注 册 一 致 性 。CLASS 表 中 课程 的 Enrollment 属 性 值 必须 与 TRANSscRipT 表 中 在 那个 学 年 / 
学 期 注册 这 门 课程 的 学 生 数 目 相同 。 这 是 由 图 12-4 中 的 ENROLLMENTCoNSISTENCcY 断 言 
执行 的 。 

“一 名 教师 不 可 能 在 同一 学 期 内 同时 教授 两 门 课程 。 在 CLAss 表 中 不 存在 两 行 有 相同 的 
ClassTime、Semester、Year 和 InstructorId。 这 由 5.7 节 中 CLAss 表 的 UNIQUE 约 束 执行 。 

“两 门 课程 不 可 能 在 同一 学 期 内 同一 时 间 在 同一 教室 里 教授 。 在 表 CLAss 中 不 存在 两 行 有 
相同 的 ClassroomId、Semester、Year 和 ClassTime。 这 由 5 7 节 中 表 CLASS 的 UNIQUE 约 东 
执行 。 

* 注册 某 门 课程 的 学 生 必须 完成 该 课程 所 有 的 预备 课程 并 且 成 绩 在 C 以 上 。TRANSCRIPT 表 
中 的 每 行 i 具有 属性 Studld、CrsCode、Semester 和 Year， 如 果 在 REQUIRES 表 中 存在 茶 些 
行 i 具 有 相同 的 CrsCode 值 ， 并 且 EnforcedSince 的 值 在 i 中 的 Semester 前 ， 那 么 对 每 个 4 在 . 
TRANSCRIPT 表 中 必 存 在 一 行 ,， 它 具有 相同 的 StudId，、 其 CrsCode 值 与 1, 的 PrereqCrsCode 
相同 ， 具 有 更 早 的 Semester 和 Year， 并 且 Grade 在 C 以 上 。 这 是 通过 在 12.6.3 的 注册 事务 
中 调用 方法 checkPrerequisitesO 执 行 的 。 . 

。 一 个 学 生 不 能 注册 在 同一 时 间 进 行 的 不 同 课程 。TRANSCRIPT 表 中 不 存在 具有 相同 StudId 
的 两 行 ， 以 至 于 其 CrsCode、SectionNo、Semester 和 Year 在 CLAss 表 中 有 相同 的 
ClassTime。 这 个 约束 还 没有 实现 ， 留 作 练习 。 
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。 在 任 一 学 期 学 生 注册 的 课程 不 能 超过 20 个 学 分 。 设 5 为 TRANSCRIPT 表 中 具有 相同 StudId、 
Semester 和 Year 的 所 有 行 的 集合 ， 那 么 CoursE 表 中 与 5 中 CrsCode 值 对 应 的 CreditHours 的 
总 和 必须 小 于 或 者 等 于 20。 这 是 通过 在 12.6.3 节 的 注册 事务 中 调用 方法 
checkRegisteredCredits() 执 行 的 。 

。 分 配给 某 门 课程 的 教室 的 座位 数 不 能 少 于 该 门 课程 允许 的 最 大 注册 人 数 。 如 果 cl 和 cr 分 
别 是 CLASS 表 和 CLASSROOM 表 中 的 行 ， 它 们 具有 相同 的 CLassroomId， 那 么 cl 中 
MaxEnrollment 的 值 不 能 大 于 cr 中 Seats 的 值 。 这 是 由 图 12-4 中 的 RooMADpEQUAcY 断 言 执 
行 的 。 

。 一 个 用 字母 表示 的 有 效 成 绩 不 能 改 成 Incomplete。 一 旦 A、B、C、D 或 者 F 被 赋 给 表 
TRANSCRIPT 中 某 行 的 Grade 属性 ， 就 不 能 在 以 后 改 成 IT， 这 是 通过 CANTCHANGEGRADETOI 
触发 器 执行 的 ， 见 图 12-4。 

图 12-4 通 过 定义 模式 的 断言 和 触发 器 部 分 完成 数据 库 设 计 。 


12.6.2 设计 注册 事务 


现在 使 用 12.1.1 节 G 部 分 所 给 的 形式 设计 注册 事务 。 当 一 个 学 生 想 注册 某 门 课程 的 时 候 ， 
他 先 启动 程序 ， 这 时 GUI 出 现下 一 学 期 可 选择 的 课程 。 选 定 某 门 课程 以 后 ，GUI 通 过 构造 器 
ClassTable() 生 成 Jlava 类 ClassTable 的 一 个 实例 对 象 。 然后 学 生 在 GUI 上 按 下 注册 按钮 ， 这 个 新 
对 象 将 调用 注册 事务 (该 事务 的 代码 在 这 个 类 的 Register0 方 法 中 )。 | 

1) 事务 名 称 


public int Register(Connection con, String sid) 


这 个 事务 是 作为 ClassTable 类 的 一 个 方法 实现 的 ， 由 这 个 类 的 具体 实例 调用 。 变 量 
courseId 和 sectionNo 通 过 类 的 构造 器 ClassTableO0 设 置 ， 以 对 应 某 门 课程 。 
2) 描述 事务 经 过 注册 正确 性 检查 后 批准 一 名 学 生 注册 某 门 课程 。 
3) 参数 
a. Connection con 数据 库 连 接 标识 符 。 
b. String sid 注册 学 生 的 Id。 
4) 返回 值 
a. 如 果 注 册 成 功 ， 返 回 常量 OK。 
b. 如 果 在 动作 部 分 描述 的 任何 一 个 检查 失败 ， 返 回 一 个 对 应 于 那个 失败 的 字符 串 。 
c. 如 果 数据 库 操作 失败 ， 返 回 用 户 定义 的 常量 FAIL。 
5) 调用 口 ”因为 没有 给 出 完整 的 设计 和 其 他 类 与 方法 的 名 称 ， 所 以 这 里 没有 相应 的 内 容 。 
6) 调用 1 
a. checkCourseOffering() 
b. checkCourseTaken() 
c. checkTimeConflict() 
d. checkRegisteredCredits() 
e. checkPrerequisites() 
f. addRegisterInfo() 








前 5 个 函数 执行 动作 部 分 所 描述 的 检查 。 如 果 所 有 检查 成 功 ， 最 后 一 个 函数 将 更 新 
数据 库 以 完成 注册 。 
7) 先决 条 件 
a. 参数 sid 对 应 的 学 生 已 经 经 过 认证 。 
b. 数据 库 已 经 打开 ， 并 已 经 创建 连接 con。 
c. 已 经 在 连接 上 执行 JDBC 方 法 setAutoCommit(false)。 
8) 隔离 级 别 SERIALIZABLE: 通过 下 面 的 调用 设置 : 
setTransactionIsolation (Connection.TRANSACTION_SERIALIZABLE) 


9) 动作 


a. 文本 描述 
i. 事务 检查 下 列 内 容 : 
a) 在 下 学 期 提供 的 课程 。 
b) 学 生还 没有 注册 这 门 课程 ， 目 前 没有 参加 这 门 课程 ， 也 没有 在 这 门 课程 获得 C 
或 者 以 上 的 成 绩 。 


c) 学 生 没 有 注册 在 同一 时 间 进 行 的 课程 。 

d) 学 生 在 下 学 期 选择 的 课程 学 分 总 和 将 不 会 超过 20。 

0) 学 生 已 经 完成 (或 者 正在 进行 ) 这 门 课程 的 所 有 预备 课程 ， 成 绩 都 在 C 或 者 
以 上 。 

ii. 如 果 学 生 通 过 所 有 的 检查 ， 事 务 完成 注册 ， 相 应 地 在 TRANSCRIPT 表 中 为 这 个 学 生 
和 课程 增加 一 行 记录 ， 并 在 CLAss 表 中 将 这 门 课程 的 Enrollment 属 性 加 1。 最 后 提 


交 返 回 状态 OK。 
. 访问 的 表 


Ss 


i. #2 # LGR AESTUDENT. COURSE, REQUIRES, CLASS#ITRANSCRIPT, 
ii. 更 新 包括 表 TRANSCRIPT 和 CLASS。 
. 错误 情形 
i. 正确 性 检查 
如 果 动 作 部 分 中 的 任何 一 个 检查 失败 ,事务 会 中 止 并 返回 标识 这 个 失败 的 状态 。 
例如 ， 如 果 学 生 已 经 学 完 这 门 课程 并 且 成 绩 在 C 以 上 ， 那 么 checkCourseTaken() 方 
法 就 会 返回 用 户 定义 的 常量 CourseTaken 作 为 状态 ，Register() 事 务 返 回 该 状态 。 同 
样 ， 如 果 检 测 出 时 间 安 排 有 冲突 ， checkTimeConflict() 方 法 返回 TimeConflict， 事 
务 返 回 该 状态 。 调 用 方法 负责 生成 相应 的 错误 消息 。 
ii. 系统 执行 的 自动 约束 检查 
注册 的 学 生 数 不 能 超过 课程 最 大 允许 注册 人 数 MaxEnrollment (这 是 由 断言 执 
行 的 )。 如 果 检 查 失败 ，DBMS 会 中 止 事务 ， 调 用 过 程 生成 相应 的 消息 。 
iii. 其 他 异常 情况 
如 果 数 据 库 操作 失败 ， 事 务 中 止 并 返回 FAIL， 调 用 过 程 负责 生成 相应 的 错误 
消息 。 


O 
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12.6.3 部 分 注册 事务 程序 


下 面 的 代码 是 用 Java 编 写 的 部 分 注册 事务 程序 。 程 序 定 义 ClassTable 类 和 关键 的 方法 
Register()， 这 个 方法 指定 课程 注册 事务 。 另 外 ,程序 提供 一 致 性 检查 的 方法 
checkCourseTaken() 的 代码 ， 但 同时 忽略 其 他 类 似 的 方法 。 

这 个 方法 的 结构 易于 编程 和 理解 。 首 先进 行 必 要 的 检查 决定 是 否 允 许 注 册 请 求 ， 每 个 检 
查 都 由 一 个 独立 的 过 程 完成 。 如 果 所 有 的 检查 通过 ， 过 程 addRegisterInfo() 会 更 新 表 。 如 果 
更 新 成 功 ， 就 提交 事务 。 检 查 和 更 新 执行 的 数据 库 动作 可 以 作为 数据 库 服 务 器 上 的 存储 过 程 
实现 。 

正如 设计 指出 的 那样 ， 所 有 错误 和 成 功 信息 不 是 由 注册 事务 生成 的 ， 而 是 由 调用 注册 事 
务 的 GUI 程序 根据 事务 返回 的 值 产 生 的 。 这 种 设计 的 优点 是 允许 系统 在 二 层 或 者 三 层 的 体系 
结构 上 实现 ， 这 种 体系 结构 由 控制 屏幕 显示 的 表示 服务 器 (presentation server) 和 完成 实际 
工作 的 应 用 服务 器 (application server) 组 成 (在 第 22 章 将 讨论 事务 的 多 层 体 系 结构 )。 使 用 
三 层 体 系 结构 的 学 生 注册 系统 ， 在 表示 服务 器 上 执行 GUI 程 序 ， 在 应 用 服务 器 上 执行 注册 方 
法 ， 而 在 数据 库 服 务 器 上 执行 设计 文档 G.6 节 中 列 出 的 存储 过 程 。 


public class ClassTable 
{ 
private String courseld; // The course Id of the class 
private String sectionNo; / The section number of the class 
// General return codes 
final public static int FAIL = -1; 
final public static int OK = 0; 
// Return codes for the various consistency checks 
final public static int CourseNotOffered = 1; 
final public static int CourseTaken = 2; 
final public static int TimeConflict = 3; 
final public static int TooManyCredits = 4; 
final public static int PrerequisiteFailure = 5; 


/ The class constructor 
public ClassTable(String courseId, String sectionNo) 
{ 

this.courseId = courseld; 

this.sectionNo = sectionNo; 


} 


// The registration transaction 
public int Register(Connection con, String sid) 


{ 
int status = OK; // return code of check*Status() methods 
int addResult = OK; // return code of addRegisterInfo() 
try f 


// Make all the required consistency checks 

if ((status = checkCourseOffering(con,sid)) != OK) { 
con.rollback(); // Course not offered 
return status; 

} else if ((status = checkCourseTaken(con,sid)) != OK) { 
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con.rollback(); // Course already taken 
return status; 

} else if ((status = checkTimeConflict(con,sid)) != OK) { 
con.rollback() ; / Time conflict found 


return status; 
} else if ((status = checkRegisteredCredits(con,sid)) != OK) { 


con.rollback(); // Too many credits 
return status; 

} else if ((status = checkPrerequisites(con,sid)) != OK) { 
con.rollback(); . /Lacks prerequisites 


return status; 
} 
// Consistency checks OK. Update tables now 
if ((addResult = addRegisterInfo(con,sid)) != OK) { 
// Failed to update tables—rollback 
con.rollback() ; 
return FAIL; 
} 
// Registration succeeded 
con.commit() ; 
return OK; 
} catch (SQLException sqle) { 
// Catches exceptions raised during execution of commit or rollback 
return FAIL; 
} // try-catch 


} // Register() 


下 面 的 程序 实现 Register() 中 进行 的 一 个 检查 ， 检 查 学 生 已 经 学 过 课程 并 获得 符合 要 求 的 
成 绩 。 


// Another method of class ClassTable 
private int checkCourseTaken (Connection con, String sid) 
{ 
// Construct the SQL command. Observe the use of single quotes 
// and spaces to produce a valid SQL statement 
// Also note: courseld is a variable defined in class ClassTable 
String SQLStatement = "select CrsCode from Transcript" 
+ " where StudId ='" + sid 
+ "' and CrsCode ='" + courselId 
+ "' and Grade in ('A','B','C',NULL)"; 
Statement stmt; 
try { 
stmt = con.createStatement(); 
ResultSet rs = stmt.executeQuery(SQLStatement) ; 
// If the result set is non-empty, course has been taken 
if (rs.nextQ) { 
// course has been taken 
stmt .close(); 
return CourseTaken; 
} 
N course has not been taken 
.stmt.close(); 
return OK; 
} catch(SQLException sqle) { 
// catches exceptions raised during execution of SELECT 
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return FAIL; 
} // try-catch 
} //end of checkCourseTaken () 


// Other methods of class ClassTable are defined here 


} //end of class definition for ClassTable 


12.7 参考 书目 


本 章 的 许多 主题 在 标准 的 软件 工程 书籍 中 都 有 更 详细 的 讨论 ， 例 如 [Summerville 1996, Pressman 
1997, Schach 1990]。 而 建立 模型 、 设 计数 据 库 和 事务 处 理应 用 中 涉及 的 特殊 的 主题 在 [Blaha and 
Premerlani 1998] 中 进行 讨论 。 


12.8 练习 


12.1 为 一 个 简单 的 计算 器 准备 设计 文档 和 测试 计划 。 
12.2 a. 为 什么 黑 盒 测试 不 能 测试 规格 说 明 中 的 所 有 方面 ? 
b. 为 什么 白 盒 测试 通常 不 能 测试 代码 中 的 所 有 执行 路 径 (这 不 意味 着 白 盒 测试 不 能 访问 代码 的 所 
有 行 和 分 支 ) ? 
123 为 什么 并 发 系统 (例如 操作 系统 ) 很 难 测试 ? 为 什么 事务 处 理应 用 即使 是 并 发 的 ， 却 不 那么 难 测 
O w? i 
12.4 从 以 下 方面 说 明 渐 进 式 系统 开发 的 优点 : 
a. 资助 项 目的 企业 经 理 
b. 项 目 经 理 
c. 实现 团队 
12.5 在 12.6.2 节 给 出 的 注册 事务 设计 中 ， 一 些 必需 的 检查 是 在 模式 中 执行 的 ， 而 一 些 检查 是 在 事务 程序 
中 执行 的 。 l 
a. 哪些 在 程序 中 执行 的 检查 可 以 在 模式 中 执行 ? 
b. 修改 模式 执行 这 些 检查 。 
12.6 重 写 12.6.3 节 的 注册 事务 程序 。 
a. 使 用 存储 过 程 执 行 注 册 检 查 。 
b. 使 用 一 个 存储 过 程 执行 所 有 的 检查 ， 而 不 是 像 程序 中 每 个 检查 都 有 相应 的 过 程 。 
c. 使 用 C 和 代入 式 SQL。 
d. 使 用 和 ODBC。 
12.7 评价 12.6.3 节 中 注册 事务 程序 的 编程 风格 。 
12.8 为 12.6.2 节 中 注册 事务 程序 准备 测试 计划 。 
12.9 为 学 生 注册 系统 的 注销 事务 做 以 下 的 准备 工作 : 
a. 准备 设计 
b. 编写 程序 
c. 准备 测试 计划 





第 13 章 查询 处 理 基 础 


理解 查询 处 理 的 原理 和 方法 有 助 于 应 用 程序 设计 者 设计 出 更 好 的 系统 。 我 们 在 这 一 章 中 
研究 用 于 判定 基本 关系 运算 符 的 方法 ， 并 讨论 它们 对 物理 数据 库 设 计 的 影响 。 第 14 章 将 讨论 
查询 处 理 更 高 级 的 部 分 : 查询 优化 。 


13.1 外 部 排序 


排序 是 用 于 计算 机 编程 的 许多 算法 中 重要 的 一 部 分 ， 也 是 支持 关系 运算 的 核心 算法 。 例 
如 ， 排 序 是 消除 重复 元 组 最 有 效 的 方法 之 一 ， 也 是 一 些 联结 算法 的 基础 。 关 系数 据 库 管理 系 
统 中 用 于 处 理 查询 的 排序 算法 不 是 在 基本 算法 课程 中 介绍 的 那些 排序 算法 。 后 一 类 算法 在 所 
有 数据 都 存储 在 主 存 中 时 执行 排序 、 而 这 通常 在 数据 库 环境 中 是 不 适用 的 。 当 文件 很 大 只 能 
存放 在 外 存 (如 磁盘 ) 上 时 ， 我 们 就 要 用 到 外 部 排序 (external sorting). 

外 部 排序 的 主要 思想 是 把 文件 的 一 部 分 放 入 主 存 ， 用 一 种 已 知 的 内 存 排序 算法 (如 快速 
排序 ) 来 对 它们 进行 排序 ， 然 后 把 结果 存 回 磁盘 。 这 样 就 产生 了 若干 有 序 的 文件 片段 ， 之 后 
必须 合并 这 些 文件 片段 来 产生 一 个 有 序 的 文件 。 因 为 执行 一 次 输入 /输出 操作 的 时 间 比 执行 一 
条 指令 的 时 间 高 出 几 个 数量 级 ， 所 以 可 以 认为 输入 /输出 的 代价 决定 了 内 存 排序 的 代价 。 因 此 ， 
外 部 排序 的 计算 复杂 性 通常 只 用 磁盘 读 写 的 次 数 来 衡量 。 典 型 的 外 部 排序 算法 包含 了 两 个 阶 
BL: 部 分 排序 和 合并 。 

1. 部 分 排序 

部 分 排序 阶段 非常 简单 。 假 设 我 们 在 主 存 中 有 一 个 缓冲 区 ， 可 以 容纳 下 M 页 用 于 排序 ， 
而 文件 有 F 页 。F 通 常 比 M 要 大 得 多 。 第 一 个 阶段 的 算法 如 下 : 


do { 
° read M pages from disk into main memory 
sort them in memory with one of the known methods (assume 
that, apart from the M-page buffer, additional 
memory is available for in-memory sorting) 
dump the sorted file segment into a new file 

} until (end-of-file) 

我 们 用 术语 运行 (run) 来 指 代 由 上 面 循环 的 一 次 迭代 产生 的 有 序 文 件 片 段 。 运 行 的 大 小 
是 片段 中 页 的 数目 。 因 此 ， 第 一 阶段 产生 了 [F/MI1 个 有 序 的 运行 ， 代 价 是 2F 次 磁盘 输入 /输出 
操作 (为 简单 起 见 ， 我 们 假设 每 次 输入 /输出 操作 只 在 磁盘 和 内 存 之 间 传 输 一 页 ， 这 里 的 符 
号 | | 表示 取 大 于 或 等 于 F/M 的 最 邻近 的 整数 的 操作 )。 部 分 排序 阶段 如 图 13-1 所 示 ， 其 中 我 们 
假设 每 个 块 包含 两 个 记录 。 

2. 上 路 合并 

算法 的 下 一 个 阶段 是 取出 有 序 的 运行 ， 把 它们 合并 成 更 大 的 有 序 运行 。 重 复 这 个 过 程 直 
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到 我 们 只 剩 下 一 个 有 序 运行 为 止 ， 这 就 是 我 们 的 最 终 目的 :最 初 文件 的 有 序 版 本 。k 路 合并 算 
法 取 k 个 大 小 为 R 页 的 有 序 运 行 来 产生 一 个 大 小 为 KR 的 有 序 运行 ， 如 图 13-2 所 示 。 实 际 的 算法 
如 下 所 示 : 
while (there are nonempty input runs) { 
choose a smallest tuple (with respect to the sort key) in each 


run, and output the smallest among these 
delete the chosen tuple from the respective input run 


[ss [zee [v0 [er fon fee | [7s | 


} 








图 13:2 k 路 合并 


因为 每 个 运行 都 是 有 序 的 ， 所 以 选择 步 遇 是 很 简单 的 ， 其 原因 是 一 个 运行 中 余下 的 最 小 


元 素 总 是 它 当前 的 头 元 素 。 图 13-3 说 明了 2 路 合并 算法 的 重复 应 用 ， 图 13- -4 说 明了 3 路 合并 的 
情况 。 





图 13-3 在 2 路 合并 中 合并 有 序 运行 
大 小 为 R 的 k 个 运行 的 路 合并 的 代价 是 多 少 ? 显然 ， 必须 扫描 每 个 运行 一 次 ， 然 后 整个 输 





一 f= 


出 必须 写 回 磁盘 。 因 而 代价 是 2kR。 因 为 最 初 可 能 有 多 于 个 的 运行 ， 所 以 我 们 把 这 些 运 行 划 
分 为 若干 组 ， 每 组 有 k 个 运行 ， 再 分 别 对 每 组 应 用 k 路 合并 。 如 果 把 这 个 过 程 也 作为 一 个 步 又 ， 
并 且 开 始 的 时 候 有 AN 个 运行 ， 那 么 就 有 | NK ] 个 组 ， 合 并 步骤 总 代价 的 上 界 是 2RN。 注 意 ， 这 
个 值 并 不 依赖 于 K。 另 外 ， 因 为 在 下 一 个 合并 步骤 中 ， 开 始 有 [NAK1 个 运行 ， 每 个 运行 的 最 大 
大 小 是 :RKR， 所 以 合并 的 代价 不 会 超过 2RN， 并 上 且 得 到 [N/R 1] 个 运行 。 实 际 上 ， 通 过 推理 很 容 
易 看 出 这 个 输入 /输出 代价 的 上 界 对 于 合并 算法 的 每 一 步 都 是 成 立 的 。 


15 0 | 





图 13-4 3 路 合并 中 的 合并 选择 运行 


下 一 个 问题 是 在 外 部 排序 算法 的 合并 阶段 的 值 应 该 是 多 少 。 如 果 开 始 有 N 个 运行 ， 每 一 步 
DUT AI, DAB RAB AB! log, N 1。 因 而 ， 算 法 整个 合并 阶段 的 代价 是 2RN * log, N, 
这 里 R 是 有 序 运行 的 初始 大 小 。 因 为 在 我 们 的 例子 中 ，R = M ( 即 我 们 可 以 使 用 整个 缓冲 区 来 
产生 最 大 可 能 的 初始 运行 )， 所 以 N = [F/M ] ,我 们 可 以 得 出 结论 ， 代 价 是 2F * logkJ F/M]. 

由 此 可 知 ，k 越 大 ， 外 部 排序 的 代价 越 小 。 那 么 为 什么 我 们 不 能 取 k 为 可 能 的 最 大 值 ( 即 
初始 有 序 运行 的 数目 ) W? 答案 是 我 们 受到 分 配给 外 部 排序 过 程 的 主 存 缓冲 区 大 小 MW 的 限制 。 
这 暗示 我 们 应 该 让 k 尽 可 能 地 大 以 便 充 分 利用 这 块 内 存 。 因 为 在 合并 的 时 候 必 须 至 少 分 配 一 页 
来 收集 输出 〈 周 期 性 的 整体 传 向 磁盘 )， 所 以 K 的 最 大 值 就 是 M-1。 把 这 个 值 替换 到 前 面 的 代 
价 估计 中 ， 就 得 到 了 下 面 的 估算 : 

2F(logw-yF - logm-nM) = 2FUdogw-nF-1) 

最 后 ， 把 这 个 代价 和 部 分 排序 阶段 的 代价 合 在 一 起 ， 就 可 以 估算 出 整个 外 部 排序 过 程 的 

代价 : 
2F * loga-yF (13.1) 

在 商用 数据 库 管理 系统 中 ， 外 部 排序 算法 是 高 度 优化 的 。 它 们 不 仅 考虑 了 初始 运行 的 内 
存 排序 的 代价 ， 而 且 还 考虑 到 在 一 次 输入 /输出 操作 中 传输 多 页 比 执行 多 次 输入 /输出 操作 (一 
次 传输 一 页 ) 要 更 加 高 获 。 例 如 ， 如 果 缓 冲 区 可 以 容纳 下 12 页 ， 那 么 或 者 可 以 执行 11 路 合并 
(一 次 读 一 页 )， 或 者 可 以 执行 3 路 合并 (一 次 读 三 页 )。 因 为 读 (MS) 三 页 和 读 一 页 所 需要 
的 时 间 几 乎 相同 ， 所 以 考虑 这 样 的 3 路 合并 是 合理 的 。 另 一 个 考虑 是 有 关 在 合并 操作 的 过 程 中 
将 输出 缓冲 区 整体 写 回 磁盘 时 的 延 时 问题 。 可 以 用 像 双 缓 冲 或 三 缓冲 这 样 的 技术 来 减少 这 种 
延 时 。 然 而 尽管 有 着 这 样 那样 的 简化 ， 但 是 在 本 节 中 讨论 的 算法 和 代价 估计 和 真实 系统 中 的 
情况 极为 近似 。 本 章 其 余部 分 对 算法 讨论 就 依赖 于 对 代价 估计 的 理解 以 及 这 里 讨论 的 排序 算 
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法 的 细节 。 

3. HEAP fe BY at 

上 面 描述 的 基于 合并 的 算法 是 查询 处 理 中 最 常用 的 排序 方法 ， 因 为 它 适 用 于 所 有 的 情况 ， 
并 且 不 需要 辅助 的 数据 结构 。 然 而 ， 当 存在 这 样 的 结构 时 ， 则 执行 排序 的 代价 会 更 低 。 

例如 ， 假 设 在 排序 键 上 有 二 级 B* 树 索引 。 对 树 的 叶子 实体 进行 遍历 可 以 产生 实际 数据 文 
件 的 记录 识别 号 (rid) 的 有 序列 表 。 原 则 上 ， 我 们 可 以 简单 地 顺 着 指针 ， 以 搜索 键 的 顺序 来 
检索 数据 文件 中 的 记录 。 令 人 奇怪 的 是 ， 它 并 不 比 基 于 合并 的 算法 效率 高 。 

在 决定 是 否 用 B! 树 索引 来 排序 文件 时 ， 主 要 应 该 考虑 索引 是 诊 禾 的 还 是 非 罕 答 的 。 简 单 
地 说 ， 如 果 索 引 是 聚焦 的 ， 最 好 用 B* 树 索引 ， 否 则 不 会 有 很 好 的 效果 。 如 果 索 引 是 聚 饶 的 ， 
那么 数据 文件 一 定 已 经 几乎 排 好 序 了 《通过 定义 ) ， 所 以 我 们 就 不 需要 做 什么 了 。 然 而 ， 如 果 
索引 是 非 肾 徐 的 ， 那 么 遍历 B' 树 的 叶子 并 烦 着 数据 记录 指针 将 以 随机 的 顺序 检索 主 文件 的 各 
页 。 在 最 坏 的 情况 下 ， 这 可 能 意味 着 我 们 必须 为 索引 叶子 节点 中 的 每 个 记录 传输 一 页 (回忆 
一 下 ， 我 们 之 前 的 分 析 是 基于 文件 中 页 的 数目 ， 而 不 是 记录 的 数目 )。 练 习 13.1 讨 论 了 用 非 聚 
秘 的 B" 树 来 进行 外 部 排序 的 代价 估计 。 


13.2 计算 投影 、 并 和 差 


计算 投影 、 并 和 差 操作 初 看 上 去 是 很 简单 的 。 例 如 ， 就 投影 来 说 ， 可 以 扫描 这 个 关系 ， 
然后 删除 不 想 要 的 字段 。 然 而 ， 如 果 用 户 查 询 中 有 DISTINCT 指 令 ， 情 况 就 比较 复杂 了 。 这 里 
的 问题 是 必须 清除 可 能 由 投影 操作 导致 的 重复 元 组 。 例 如 ， 如 果 我 们 把 图 4-S$ 中 的 关系 
TRANSCRIPT 的 StudId 和 Grade 属性 投影 掉 ， 那 么 元 组 (MGT123, F1994) 将 在 结果 中 出 现 两 次 。 
因而 ， 我 们 必须 找到 高 效 的 技术 来 消除 重复 元 组 。 

在 计算 两 个 关系 的 并 的 时 候 也 可 能 出 现 与 重复 一 样 的 问题 。 在 计算 两 个 关系 的 差 r-s 的 时 
候 是 不 会 引起 重复 的 ， 除 非 最 初 的 关系 r 已 经 有 重复 了 了。 然而， 我 们 面临 的 问题 是 相似 的 : 我 
们 必须 识别 r 中 与 s 中 相同 的 元 组 。 . 

有 两 种 技术 可 以 用 来 找 出 相同 的 元 组 : 排序 (我 们 在 前 一 节 中 讨论 过 这 种 技术 ) 和 散 列 。 
我 们 首先 把 这 些 技术 应 用 到 投影 操作 符 上 ， 然 后 讨论 对 并 和 差 操作 符 来 说 所 需要 做 的 修改 。 

1. 基于 排序 的 投影 

这 个 技术 首先 扫描 初始 关系 ， 删 除 要 被 投影 掉 的 元 组 分 量 ， 再 把 结果 写 回 磁盘 (我 们 假 
设 没 有 足够 的 内 存 来 存储 这 个 结果 )。 这 个 操作 的 代价 是 2 数量级 ， 这 里 F 是 关系 中 页 的 数目 。 
然后 排序 这 个 结果 ， 代 价 是 2F*logw-wF， 这 里 M 是 用 来 排序 的 主 存 页 的 数目 。 最 后 ， 我 们 再 
扫描 一 次 结果 ( 代价 是 2F)， 因 为 相同 的 元 组 彼此 相 邻 (因为 关系 是 排 好 序 的 )， 所 以 我 们 很 
容易 删除 重复 的 元 组 。 | 

实际 上 ， 如 果 把 排序 和 扫描 结合 起 来 效果 会 更 好 。 首 先 ， 我 们 在 排序 算法 的 部 分 排序 阶 
段 从 元 组 中 删除 不 想 要 的 分 量 。 在 该 阶段 ， 我 们 要 扫描 初始 关系 ， 所 以 去 除 这 些 元 组 分 量 不 
需要 额外 的 磁盘 输入 /输出 开销 。 其 次 ， 我 们 把 消除 重复 元 组 和 输出 有 序 运行 到 磁盘 的 步骤 合 
并 起 来 ， 这 样 就 省 去 了 最 后 用 来 删除 重复 所 需要 的 那 遍 扫描 。 因 为 每 个 这 样 的 步骤 都 要 写 出 
有 序 元 组 的 块 ， 所 以 消除 重复 可 以 在 主 存 中 完成 ， 不 需要 额外 的 输入 /输出 开销 。 

因而 ， 基 于 排序 的 投影 的 代价 是 2F*logww-wF。 另 外 ， 如 果 我 们 考虑 到 第 一 次 扫描 可 能 
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产生 较 小 的 关系 (大 小 是 wF， 这 里 a<1 是 减 小 因子 )， 那 么 投影 的 开销 就 可 能 更 低 了 ( 见 练 
13.2). 

2. 基于 散 列 的 投影 

快速 识别 重复 的 另 一 种 方法 是 用 散 列 函数 。 假设 散 列 函数 产生 范围 在 1 ~ M-1 之 间 的 整数 ， 
并 且 在 主 存 中 有 M 个 缓冲 页 ， 它 包含 了 (M-1) 页 的 散 列表 和 一 个 输入 缓冲 。 算 法 的 工作 原 
理 如 下 。 在 第 一 阶段 ， 扫 描 初 始 关 系 。 在 这 次 扫描 中 ， 我们 去 除 要 投影 掉 的 元 组 分 量 , 元 组 
的 其 余 分 量 在 余下 的 属性 上 进行 散 列 。 每 当 散 列表 的 一 页 写 满 时 ， 就 把 它 整 体 传输 到 磁盘 上 
相应 的 桶 中 去 。 这 一 步 如 图 13-5 所 示 。 








图 13-5 散 列 输入 关系 到 桶 


显然 ， 重 复元 组 总 是 散 列 到 同一 个 桶 中 去 ， 所 以 我 们 可 以 分 别 在 每 个 桶 中 消除 重复 。 在 
算法 的 第 二 个 阶段 完成 重复 消除 。 假 设 每 个 桶 都 可 以 放 进 主 在， 那么 可 以 用 如 下 方法 完成 第 
二 个 阶段 : 整体 读 取 每 个 桶 ， 在 主 存 中 对 它 进行 排序 来 消除 重复 ， 再 把 它 整 体 写 进 磁盘 。 整 
个 过 程 的 输入 /输出 复杂 度 是 4F (如 果 考虑 投影 的 减 小 因子 a(a<1)， 那 么 结果 是 Ft3aF)。 如 
果 单个 的 桶 不 能 放 进 内 存 中 ， 那 么 必须 用 外 部 排序 来 对 它们 进行 排序 ， 而 这 将 引起 额外 的 输 
入 /输出 开销 。 练 习 13.3 讨 论 了 这 种 情况 下 的 代价 估计 。 

3, 基于 排序 方法 和 基于 散 列 方法 的 比较 

假设 每 个 桶 都 可 以 放 进 主 存 即使 对 于 很 大 的 文件 也 是 可 以 实现 的 。 例 如 ， 假 设 做 投影 的 ， 
程序 有 10 000 页 的 缓冲 区 。 这 样 的 缓冲 区 只 需要 40M 的 内 存 ， 廉 价 的 台式 电脑 也 会 有 这 么 大 的 
内 存 。 我 们 可 以 先 用 这 个 缓冲 区 来 存储 散 列 表 ， 然 后 用 它 来 读 取 桶 。 假 设 每 个 桶 都 可 以 放 进 
缓冲 区 ， 那么 处 理 10 000 x 10 000= 10" 页 的 文件 (400G) 只 需要 不 到 4 x 10? 次 页 传输 的 开销 。 
基于 排序 的 投影 算法 真 的 能 表现 得 更 好 吗 ? 在 这 种 情况 下 ， 它 的 开销 是 2 x 10°logos110°, A 
微 高 了 一 些 。 

因此 ， 要 外 部 排序 散 列 桶 的 可 能 性 就 很 小 了 。 更 大 的 风险 是 使 用 的 散 列 函 数 不 会 把 元 组 
平均 分 配 到 各 个 桶 中 去 。 虽 然 一 般 来 说 ， 在 这 种 情况 下 桶 是 可 以 放 进 内 存 的 ， 但 是 其 他 一 些 
桶 却 不 能 。 在 最 坏 的 情况 (这 是 不 太 可 能 的 ) 下 ， 所 有 元 组 可 能 都 落 入 了 同一 个 缓冲 区 里 ， 
这 将 要 求 进行 外 部 排序 。 扫 描 初 始 关系 并 把 它 复制 到 单个 桶 的 代价 将 是 2F， 再 加 上 排序 桶 并 
消除 重复 的 代价 将 是 2Flogw-bF， 这 与 基于 排序 的 投影 相 比 就 浪费 了 2F 次 页 传输 。 

4. 计算 并 和 差 

计算 并 类 似 于 计算 投影 ， 只 是 不 需要 去 掉 不 想 要 的 属性 。 为 了 计算 差 r-s， 我 们 把 r 和 s 都 
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排 好 序 ， 然 后 类 似 于 合并 过 程 那样 并 行 扫描 它们 。 然 而 ， 每 当 我 们 发 现 r 的 一 个 元 组 也 在 s 中 
时 ， 我 们 不 是 合并 元 组 ， 而 是 不 把 它 加 进 结果 中 。 

在 基于 散 列 的 差 计 算 中 ， 我 们 可 以 像 前 面 所 说 的 那样 把 r 和 s 散 列 到 桶 。 然而 ， 在 每 个 桶 
中 我 们 必须 区 分 来 自 r 的 元 组 和 来 自 s 的 元 组 。 在 第 二 阶段 ， 必 须 分 别 对 每 个 桶 应 用 差 操作 。 


13.3 计算 选择 


计算 选择 运算 符 可 能 比 计算 投影 和 集合 运算 复杂 得 多 ， 可 能 要 用 到 更 多 的 技术 。 针 对 特 
定 的 选择 运算 符 选择 技术 时 取决 于 选择 条 件 的 类 型 和 涉及 的 关系 的 物理 组 织 。 通 常 ， 数 据 库 
管理 系统 自动 决定 它 将 要 使 用 的 技术 ， 所 采用 的 技术 基于 我 们 下 面 要 描述 的 启发 式 方法 。 然 
而 ,理解 这 些 启 发 式 方法 就 给 了 程序 员 一 个 要 求 物理 组 织 的 机 会 ， 所 要 求 的 物理 组 织 对 于 在 . 
特定 的 应 用 程序 中 最 频繁 出 现 的 选择 类 型 是 最 佳 的 。 

我 们 首先 考虑 形 如 attr op value 的 简单 选择 条 件 ， 这 里 op 是 =、>、< 等 比较 符 中 的 一 个 ， 
然后 把 我 们 的 技术 推广 到 涉及 布尔 运算 符 的 复杂 条 件 。 

数据 库 查 询 常常 导致 两 种 不 同 的 选择 : ETEA (attr = val) 的 选择 和 基于 不 等 式 的 选 
择 ( 像 attr < val)。 后 者 称 为 范围 查询 (range query ) ， 因 为 它们 通常 成 对 出 现 来 指定 值 的 范 
H, RNG, <aur<cy (r)。 


13.3.1 具有 简单 条 件 的 选择 


计算 选择 ow op vane (7) 的 一 个 很 显而易见 的 方法 是 扫描 关系 r， 对 其 中 的 每 个 元 组 检查 选择 
条 件 ， 输 出 满足 选择 条 件 的 元 组 。 然 而 ， 如 果 只 有 一 小 部 分 元 组 满足 条 件 ， 那 么 扫描 整个 关 
系 的 代价 就 显得 太 大 了 。 在 了 解 更 多 关于 r 的 结构 信息 的 情况 下 ， 就 不 需要 做 全 部 扫描 了 。 我 
们 考虑 三 种 情况 : 1) 在 attr 上 没有 索引 ; 2) 在 attr 上 有 B'* 树 索引 ; 3) 在 artr 上 有 散 列 索 引 。 
在 第 三 种 情况 下 ， 只 能 高 效 的 处 理 等 值 选 择 〈( 即 op 是 “=”)。 在 第 二 种 情况 下 ， 可 以 高 效 处 理 
等 值 选择 和 范围 选择 ,但 是 第 三 种 情况 在 处 理 等 值 选择 时 效果 会 更 好 一 些 。 在 第 一 种 情况 下 ， 
只 能 对 r 做 全 部 扫描 了 ， 除 非 关系 r 已 经 在 attr 上 排 好 序 了 。 在 这 种 情况 下 ， 可 以 处 理 等 值 选择 
和 范围 选择 ， 但 是 没有 使 用 B* 树 索引 时 那么 高 效 。 ， 

1. 没有 索引 

通常 ， 我 们 只 能 扫描 整个 关系 r， 代 价 是 传输 F 页 (r 中 磁盘 块 的 数目 )。 然 而 ， 如 果 r 在 
attr 上 已 经 排 好 序 了 ， 那 么 我 们 可 以 使 用 二 分 法 来 找到 r 中 包含 满足 条 件 attr = value 的 第 一 条 
元 组 的 页 。 我 们 可 以 以 适当 的 方向 扫描 文件 来 检索 所 有 满足 attr op value 的 元 组 。 . 

这 种 二 分 查找 的 代价 是 与 log2F 成 正比 的 。 为 了 做 到 这 一 点 ， 我 们 还 必须 加 入 扫描 包含 合 
格 元 组 的 块 的 代价 。 例 如 ， 如 果 r 有 500 页 ， 那 么 查找 的 代价 是 [log2 5001 ， 即 传输 9 页 (加 上 
包含 合格 项 的 磁盘 块 的 数目 )。 

2. B' 树 索引 . . 

有 了 arr 上 的 B* 树 索引 ， 算 法 类 似 于 针对 排 好 序 的 文件 的 算法 。 然 而 ， 我 们 不 是 用 二 分 查 
找 ， 而 是 用 索引 来 找到 r 中 满足 条 件 attr = value 的 第 一 个 元 组 。 更 准确 地 说 ,我们 找到 包含 或 
者 指向 满足 条 件 的 第 一 个 元 组 的 B* 树 的 叶子 节点 。 我 们 从 那里 扫描 3 树 索 引 的 叶子 来 找到 指 
向 包含 满足 条 件 atrr op value 的 元 组 的 页 的 所 有 索引 项 。 
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找 出 索引 的 第 一 个 合格 的 叶子 节点 的 代价 等 于 B* 树 的 深度 。 和 以 前 一 样 ， 我 们 还 要 再 加 
上 扫描 索引 的 叶子 来 确定 所 有 合格 项 的 代价 。 当 然 这 个 代价 依赖 于 合格 项 的 数目 ， 而 合格 项 
的 数目 又 依赖 于 选择 条 件 和 关系 中 实际 的 数据 。 

然而 ， 事 实 并 没有 这 么 简单 。 到 目前 为 止 ， 我 们 只 是 描述 了 得 到 索引 项 的 过 程 。 得 到 实 

际 元 组 的 代价 取决 于 索引 是 否 是 聚 答 的 。 如 果 索 引 是 聚焦 的 ， 那 么 所 有 感 兴趣 的 元 组 存储 在 
一 页 或 相 邻 的 几 页 中 (不管 索 引 是 否 集成 到 存储 结构 中 这 都 是 正确 的 )。 例 如 ， 如 果 有 1000 个 
合格 的 元 组 ， 每 个 磁盘 块 存储 100 个 元 组 ， 那 么 得 到 所 有 这 些 元 组 (假设 我 们 已 经 找到 了 适当 
的 索引 节点 ) 需要 10 次 页 传输 。 另 一 方面 ， 如 果 索 引 是 非 聚 灸 的 ， 那 么 每 个 合格 的 元 组 可 能 
是 在 单独 的 一 块 中 ， 所 以 检索 所 有 合格 元 组 可 能 要 进行 1000 次 页 传输 ! 
”这 就 引起 了 令 人 不 悦 的 前 景 ; 要 进行 的 页 传输 次 数 与 选择 中 合格 元 组 的 数目 相同 ， 这 就 
很 有 可 能 超过 整个 关系 r 的 页 的 数目 。 幸 运 的 是 ， 稍 微 想 一 想 ， 我 们 可 以 有 更 好 一 些 的 方法 。 
让 我 们 首先 对 从 索引 中 得 到 的 合格 元 组 的 记录 Id 进行 排序 。 然 后 我 们 可 以 按 合格 记录 Id 的 升序 
来 从 关系 中 检索 数据 页 ， 这 就 保证 了 每 个 数据 页 最 多 被 检索 一 次 。 因 而 ， 即 使 是 非 京 签 索 引 ， 
其 代价 也 是 和 包含 合格 元 组 的 页 的 数目 成 正比 的 (再 加 上 搜索 索引 和 排序 记录 Id 的 代价 )。 在 
最 坏 的 情况 下 , 这 个 代价 可 以 和 初始 关系 的 页 的 数目 一 样 高 。( 但 是 不 会 像 元 组 数目 那么 大 ! ) 
这 是 因为 合格 元 组 并 不 是 像 使 用 聚 答 索引 那样 集中 在 检索 到 的 页 中 : 检索 到 的 页 可 能 只 包含 
一 个 合格 的 元 组 。 因 而 ， 应 该 优先 考虑 聚 卵 索引。 

3. 散 列 索引 . 

在 这 种 情况 下 ， 我 们 可 以 使 用 散 列 函数 来 找 出 含有 满足 条 件 attr = value 的 元 组 的 桶 。 因 
为 两 个 在 viwe 上 只 有 稍 许 差别 的 元 组 可 能 被 艇 列 到 不 同 的 桶 中 去 ， 所 以 这 个 方法 不 能 有 效 地 
用 于 像 attr < value 这 样 的 范围 条 件 。 

通常 ， 找 出 正确 的 桶 的 代价 是 一 个 常数 (对 于 好 的 散 列 函 数 来 说 接近 1.2)。 然 而 ， 检 索 元 
组 的 实际 代价 依赖 于 合格 元 组 的 数目 。 如 果 这 个 数目 比 !: 大 ， 那 么 和 B* 树 索引 的 情况 一 样 ， 实 
际 的 代价 依赖 于 索引 是 否 是 聚 乌 的 。 在 聚 秘 的 情况 下 ， 所 有 合格 元 组 集中 在 若干 邻近 的 页 中 ， 
那么 检索 的 代价 就 是 扫描 这 些 页 的 代价 。 在 非 育 匀 索引 的 情况 下 ， 元 组 分 散在 整个 数据 文件 
中 ， 我 们 就 面临 了 和 非 聚 复 的 B* 树 相同 的 问题 一 一 排序 记录 Id 导致 了 和 包含 合格 元 组 的 页 的 
数目 成 正比 的 代价 。 


13.3.2 存 取 路 径 


上 面 讨论 的 实现 关系 运算 符 的 算法 都 是 假设 对 于 要 处 理 的 关系 存在 (或 不 存在 ) 某 种 辅 
助 的 数据 结构 (索引 )。 这 些 数据 结构 和 使 用 它们 的 算法 称 为 存 取 路 径 (access path)。 到 现在 
Aik, 我 们 已 经 看 到 几 个 可 以 用 于 处 理 特定 查询 的 存 取 路 径 的 例子 : 总 可 以 使 用 文件 扫描 ; 
在 查询 中 指定 的 属性 上 已 经 排 好 序 的 文件 可 以 使 用 二 分 查找 ; 如 果 散 列 索引 或 B* 树 有 涉及 那 
些 属性 的 搜索 键 ， 则 可 以 使 用 这 两 种 索引 。 

必须 仔细 地 为 给 定 的 关系 运算 选择 存 取 路 径 。 例 如 ， 考 虑 图 4-5 中 的 TRANSCRIPT 关 系 ， 并 
假设 我 们 在 搜索 键 <StudId, Semester> 上 有 散 列 索引 。 这 个 索引 在 计算 nswara somester (TRANSCRIPT ) 
时 是 很 有 用 的 ， 因 为 我 们 可 以 确定 由 于 投影 而 产生 的 任何 重复 都 出 自 存 储 在 同一 个 桶 中 的 元 
组 。 这 就 极 大 地 简化 了 消除 重复 的 工作 ， 因 为 搜索 重复 可 以 用 一 次 处 理 一 个 桶 的 方式 完成 。 
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另 一 方面 ， 如 果 我 们 计算 rsuatacecod。 (TRANSCRIPT) ， 那 么 索引 在 消除 重复 方面 就 没有 什么 帮 
助 了 。 尽 管 元 组 上 和 2 在 <StudId, CrsCode> 上 的 投影 可 能 是 相同 的 ， 但 是 和 可 能 被 散 列 到 不 
同 的 桶 中 去 ， 因 为 它们 在 Semester 属 性 上 的 值 可 能 不 同 。 为 了 使 用 散 列 来 消除 重复 ， 散 列 索 
引 的 整个 搜索 键 必须 包含 在 没有 被 投影 掉 的 属性 集合 中 ( 见 练习 13.4)。 

然而 ， 上 面 的 散 列 索引 在 计算 表达 式 Gswwqrs-666666666AGrade='A'ASemester-'F1994' (TRANSCRIPT) 时 是 
很 有 用 的 。 我 们 可 以 使 用 散 列 索 引 来 检索 满足 部 分 条 件 Studld=666666666 A Semester='F1994' 
的 元 组 ， 然 后 扫描 得 到 的 结果 (估计 可 能 会 比较 小 ) 来 找 出 还 满足 Grade='A' 的 元 组 。 然 而 ， 
这 个 索引 在 计算 表达 式 Oswarse66666666 (TRANSCRIPT) 的 时 候 是 没有 多 大 用 处 的 ， 因 为 满足 条 件 
的 元 组 可 能 分 散在 不 同 的 桶 中 。 

最 后 ， 在 <Grade, StudId> 上 的 散 列 索引 对 于 计算 关系 表达 式 acuaaec (TRANSCRIPT) 是 没有 
多 大 用 处 的 ， 但 是 在 搜索 键 <Grade, StudId> 上 的 B* 树 索引 是 有 帮助 的 〈 尽 管 搜索 键 是 〈StudId， 
Grade) 的 B* 树 可 能 没有 帮助 )。 为 了 使 用 散 列 函数 ， 我 们 要 为 StudId 提 供 所 有 可 能 的 值 ， 还 要 
提供 高 于 C 的 Grade 的 值 ， 而 这 是 不 实际 的 。 相 比 之 下 ， 因 为 Grade 是 B* 树 搜索 键 的 前 缓 ， 所 以 
我 们 可 以 使 用 这 棵 树 来 有 效 地 找 出 所 有 具有 搜索 键 <g, id> (这 里 的 g 高 于 C) 的 索引 项 。 

这 个 讨论 引出 了 一 个 概念 : 什么 时 修 存 取 路 径 才 能 徐 盖 一 个 特定 关系 运算 符 的 使 用 。 我 
们 只 为 满足 下 面条 件 的 选择 运算 符 准确 地 定义 这 个 概念 其 选择 条 件 是 形 如 attr op value 
的 合 取 。 投 影 和 差 运算 符 留 作 练习 。 

覆盖 把 存 取 路 径 和 可 以 用 这 些 路 径 来 计算 的 关系 表达 式 联系 起 来 。 考 虑 如 下 的 关系 表 
达 式 


O atn op, vah A... A attr, opn val, (R) ( 13.2) 


这 里 R 是 关系 模式 。 当 且 仅 当下 面 的 条 件 之 一 成 立时 ， 这 个 表达 式 被 一 个 存 取 路 径 覆 盖 : 
* 存 取 路 径 是 文件 扫描 。( 文 件 扫描 显然 可 以 用 来 计算 任意 表达 式 。) 
。 存 取 路 径 是 散 列 索 引 ， 该 索引 的 搜索 键 是 属性 attr1,，…, attr, 的 一 个 子 集 ， 在 这 个 子 集中 
的 所 有 op 都 是 等 号 。( 我 们 可 以 使 用 散 列 索引 来 识别 添 是 选择 条 件 中 一 些 子 条 件 的 元 组 ， 
然后 扫描 这 个 结果 来 验证 余下 的 子 条 件 。) 
* 存 取 路 径 是 有 搜索 键 sk1,，…, si 的 B* 树 索引 ， 搜 索 键 的 某 个 前 缀 Sr，…， sh 是 attr1，…， 
attrn 的 一 个 子 集 。( 11.4.3 节 解释 了 如 何 使 用 B* 树 来 做 部 分 键 搜索 。 这 将 有 助 于 我 们 找 
出 满足 选择 中 一 些 子 条 件 的 元 组 ， 余 下 的 子 条 件 可 以 通过 对 得 到 的 结果 做 顺序 扫描 来 
验证 。) 
* 存 取 路 径 是 二 分 查找 ，R 的 关系 实例 在 属性 ski, …, sk 上 排序 。 在 这 种 情况 下 ， 和 覆盖 的 
定义 和 B!* 树 索引 上 的 定义 是 相同 的 。 
注意 , 仅 当 与 搜索 键 中 的 属性 对 应 的 所 有 比较 都 是 = 时 , 才 可 以 使 用 基于 散 列 的 存 取 路 径 。 
即使 这 些 比 较 涉 及 到 像 < 、<、> 和 > 的 不 等 号 ， 也 可 以 使 用 其 他 的 存 取 路 径 。 如 果 比 较 运 算 
符 是 二 ， 那 么 唯一 可 用 的 存 取 路 径 就 是 文件 扫描 ， 因 为 在 枚 举 关 系 中 的 所 有 合格 元 组 时 没有 
哪个 索引 是 很 有 效 的 。 
举 个 例子 ， FG ERIK KGa, >5 hoy=30Aa3='a (R), 假设 R 上 存在 B' 树 索引 ， 搜索 键 是 az an 
a。 我 们 可 以 使 用 这 个 索引 来 找 出 叶子 项 e， 其 中 az 的 值 是 30，%i 的 值 是 5。 如 果 这 样 的 项 不 存 
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在 ， 那 么 就 找 出 索引 中 紧 跟 e 的 第 一 个 项 。 我 们 可 以 从 那 一 点 开始 扫描 叶子 项 来 找 出 所 有 还 能 
使 s; 有 a 值 的 叶子 。 | 

在 我 们 继续 之 前 还 要 注意 一 个 概念 : 如 果 我 们 使 用 与 存 取 路 径 对 应 的 计算 方法 ， 那 么 存 
取 路 径 的 选择 度 (selectivity) 就 是 将 要 检索 到 的 页 的 数目 。 选 择 度 越 小 ， 存 取 路 径 就 越 好 。 
选择 度 与 计算 查询 的 代价 是 紧密 相关 的 ， 不 过 查询 代价 可 能 还 涉及 其 他 因素 。 例 如 ， 可 能 用 
到 多 个 存 取 路 径 〈 见 13.3.3 节 )， 或 者 在 输出 之 前 需要 排序 结果 (如 果 用 到 ORDER BY 子 句 )。 
显然 ， 对 于 任意 给 定 的 关系 表达 式 ， 存 取 路 径 选 择 度 依赖 于 那个 表达 式 结果 的 大 小 ， 并 且 总 
是 大 于 或 等 于 包含 结果 元 组 的 页 的 数目 。 然 而 ， 一 些 存 取 路 径 具 有 的 选择 度 更 加 接近 理论 上 
的 最 小 值 ， 而 其 他 一 些 存 取 路 径 更 加 接近 扫描 整个 文件 的 代价 。 什 么 时 候 存 取 路 径 巴 盖 表 达 
式 的 概念 有 助 于 确定 出 那些 选择 度 对 给 定 类 别 的 表达 式 很 “合理 ”的 存 取 路 径 。 


13.3.3 具有 复杂 条 件 的 选择 


我 们 现在 开始 讨论 用 于 计算 任意 选择 的 方法 。 

1. 带 合 取 条 件 的 选择 

这 些 是 上 面 考 虑 的 形 如 (13.2) ;的 表达 式 。 我 们 有 两 种 选择 : 

。 使 用 最 有 选择 性 的 存 取 路 径 来 检索 相应 的 元 组 。 这 样 的 存 取 路 径 通 过 尽 可 能 多 地 使 用 
在 选择 条 件 中 提 汉 的 属性 来 构造 搜索 键 的 前 组 。 它 以 这 种 方式 检索 到 需要 的 元 组 的 最 
小 可 能 的 超 集 ， 我 们 可 以 扫描 这 个 结果 来 找 出 满足 整个 选择 条 件 的 元 组 。 例 如 ， 假 设 
我 们 需要 计算 aande>c n SemesterFi904 (TRANSCRIPT)， 并 且 存 在 搜索 键 为 <Grade, StudId> 
的 B* 树 索引 。 因 为 这 个 存 取 路 径 覆 盖 了 选择 条 件 Grade>'C'， 所 以 我 们 可 以 用 它 来 计算 
Oorade>c (TRANSCRIPT) 。 然 后 我 们 可 以 扫描 这 个 结果 来 识别 与 1994 年 秋季 的 学 期 对 应 的 
成 绩 记 录 。 如 果 存在 搜索 键 为 <Semester, Grade> 的 B* 树 索引 ， 那 么 我 们 可 以 把 它 当 作 存 
取 路 径 来 用 ， 因 为 这 个 键 覆盖 了 两 个 选择 条 件 。 

使 用 徐 盖 该 表达 式 的 若干 存 取 路 径 。 例 如 ， 我 们 可 能 有 两 个 二 级 索引 ， 它 们 的 选择 度 都 
小 于 直接 文件 扫描 的 选择 度 。 我 们 可 以 使 用 这 两 个 存 取 路 径 来 找 出 可 能 属于 查询 结果 的 

元 组 的 rid， 然 后 计算 出 它们 rid 集 合 的 交集 。 最 后 我 们 可 以 检索 选中 的 元 组 ， 再 用 余下 
的 条 件 对 它们 测试 。 例如 ， FG FE KIK TK Og 1ua14=666666666 A Grade='A' A Semester='#1994 ( TRANSCRIPT ), 
假设 存在 两 个 散 列 索引 ， 一 个 在 Semester 上 ， 另 一 个 在 Grade 上 。 用 第 一 个 存 取 路 径 ， 
我 们 可 以 找 出 1994 年 秋季 的 那个 学 期 的 成 绩 记录 的 rid。 然 后 我 们 使 用 第 二 个 存 取 路 径 来 
找 出 成 绩 是 'A' 的 记录 的 rid。 最 后 ， 我 们 可 以 找 出 同时 属于 这 两 个 集合 的 rid， 再 去 检索 
相应 的 页 。 当 扫描 元 组 的 时 候 ， 我 们 可 以 进一步 选择 与 学 生 的 1d 是 666666666 相 对 应 的 
那些 元 组 。 

2. 带 析 取 条 件 的 选择 

当选 择 条 件 包含 析 取 的 时 候 ， 我 们 必须 首先 把 它们 转换 成 析 取 范式 disjunctive normal 

form )。 如 果 一 个 条 件 形 如 CV … V C,， 这 里 每 个 C; 是 比较 项 的 合 取 (就 像 表达 式 (13.2) 中 
的 那样 )， 那么 这 个 条 件 就 是 析 取 范 式 (disjunctive normal form ) 。 
从 原子 谓词 演算 可 以 得 知 ， 每 个 条 件 都 有 等 价 的 析 取 范式 。 例 如 ， 对 于 条 件 


(Grade='A' v Grade='B') A (Semester='F1994' v Semester='F1995') 
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相应 的 析 取 范式 是 : 


(Grade='A' A Semester='F1994') v (Grade='A' A Semester='F1995') | 
vV (Grade='B' A Semester='F1994') v (Grade='B' A Semester='F1995') 


对 于 在 析 取 范式 中 的 条 件 ， 查 询 处 理 器 必须 对 单个 的 析 取 项 检查 存在 的 存 取 路 径 ， 并 选 
择 适 当 的 策略 。 这 里 是 一 些 可 能 情况 。 

。 必 须 使 用 文件 扫描 来 计算 其 中 一 个 析 取 项 Ci。 在 这 种 情况 下 ， 我 们 可 以 在 这 个 扫描 的 过 

程 中 计算 整个 选择 表达 式 。 

。 每 个 Ci 都 存在 优 于 直接 文件 扫描 的 存 取 路 径 。 其 中 又 包含 两 种 情况 : 

1) 所 有 这 些 路 径 的 选择 度 的 总 和 接近 文件 扫描 的 选择 度 。 在 这 种 情况 下 ， 我 们 应 该 优 
先 使 用 文件 扫描 ， 因 为 索引 搜索 的 开销 和 其 他 一 些 因素 可 能 会 超过 由 于 使 用 较 复杂 
的 存 取 路 径 而 获得 的 很 小 的 潜在 收益 。 

2) 所 有 析 取 项 的 存 取 路 径 的 组 合 选择 度 比 文件 扫描 的 选择 度 要 小 得 多 。 在 这 种 情况 下 ， 
我 们 应 该 使 用 适当 的 存 取 路 径 来 分 别 计 算 cc (及 ) ， 再 对 结果 取 并 集 。 


13.4 计算 联结 


计算 投影 、 选 择 等 关系 运算 符 的 方法 只 是 计算 关系 联结 的 前 奏 。 我 们 把 注意 力 都 放 在 比 
较 不 同 存 取 路 径 上 ， 在 计算 投影 或 者 选择 时 可 能 发 生 的 最 坏 情况 是 我 们 可 能 要 扫描 或 者 排序 
整个 关系 。 这 样 的 表达 式 的 结果 也 是 很 规则 的 : 它 不 可 能 比 最 初 的 关系 还 要 大 。 

把 这 个 结论 和 关系 联结 作 一 下 比较 ， 关系 联结 中 要 扫描 的 页 的 数目 和 结果 的 大 小 都 可 能 
是 输入 大 小 的 二 次 方 倍 。 尽 管 “二 次 方 ”在 某 些 算法 具有 指数 级 复杂 度 的 应 用 程序 中 看 起 来 
并 不 是 太 精 糕 ， 但 是 这 在 数据 库 查询 计算 中 是 不 允许 的 。 因 为 数据 量 太 大 ， 而 磁盘 的 输入 / 输 
出 又 相对 较 慢 。 例 如 ， 联 结 两 个 只 是 跨越 1000 页 的 文件 可 能 就 要 进行 10“ 次 输入 /输出 操作 ， 这 
即使 对 于 批 作业 也 是 不 可 接受 的 。 因 此 ， 在 数据 库 查 询 处 理 中 要 特别 关注 联结 。 

考虑 联结 表达 式 r 54 4-s s， 这 里 4 是 r 的 属性 ，B8 是 s 的 属性 。 计 算 连 接 有 三 种 主要 的 方法 : 
帐 套 人 循环、 排序 -合并 和 基于 散 列 的 联结 。 我 们 依次 来 考虑 这 三 种 方法 。 


13.4.1 用 由 套 循环 来 计算 联结 
计算 联结 > OS 4-s s 的 一 个 显而易见 的 方法 是 使 用 下 面 的 循环 : 


foreach t € r do 
foreach t' € s do 
if t[A] = t'[B] then output (t,t') 


这 个 过 程 的 代价 可 以 用 如 下 方法 估算 。 令 B. 和 Bs 分别 是 r 和 s 中 页 的 数目 ，t 和 ts 分 别 是 r 和 s 
中 元 组 的 数目 。 容 易 看 出 ， 对 于 r 中 的 每 个 元 组 都 必须 从 头 到 尾 扫描 关系 s， 这 将 导致 TB, 次 页 
传输 。 另 外 ， 在 外 循环 中 必须 扫描 一 次 r。 结 果 ， 有 PB.+ TB 次 页 传输 。( 在 所 有 对 联结 运算 的 
代价 估算 中 ， 我 们 忽略 了 把 最 终结 果 写 进 磁盘 的 代价 ， 因 为 这 一 步 对 于 所 有 的 方法 来 说 都 是 
一 样 的 ， 而 且 对 这 一 阶段 的 估计 依赖 于 结果 的 实际 大 小 。 估 计 这 个 大 小 会 使 我 们 偏离 主题 ，. 
还 会 在 这 一 阶段 分 散 注意 力 。) 

上 面 的 代价 估计 给 了 我 们 两 个 教训 : 
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。 它 涉及 到 大 量 的 页 传输 ! 令 B,=1000，B,=100，t=10 000。 我 们 的 代价 估计 说 明 计 算 可 
能 要 求 1000+10 000 x 100=1 001 000 次 页 传输 一 一 对 于 联结 这 样 相对 较 小 的 表 来 说 这 也 
KAT (如 果 一 次 页 输入 /输出 需要 10ms， 那 么 大 约 要 花费 166 分 钟 )。 
。 循 环 的 上 顺序。 假设 不 是 在 外 层 循环 中 扫描 rz， 而 是 在 外 层 循环 中 扫描 8s， 在 内 层 循 环 中 扫 
描 r。 假 设 t,=1000。 在 代价 合算 中 互 换 r 和 s 将 会 产生 : 100+1000 x 1000=1 000 100。 虽 
然 这 个 例子 在 运算 上 的 减少 是 最 小 的 了 ( 令 人 震撼 的 9 分 钟 ! )， 但 是 容易 看 出 ， 如 果 每 
页 上 的 元 组 的 数目 在 两 个 关系 中 是 一 样 的 , 那么 在 外 层 循 环 中 要 被 扫描 的 关系 应 该 较 小 ， 
而 内 层 循环 中 被 扫描 的 关系 应 该 较 大 。 
1. Ra EMRE 
如 果 我 们 不 是 对 r 的 每 个 元 组 都 扫描 s 一 次 ， 而 是 对 r 的 每 一 页 扫描 一 次 s， 那 么 嵌 套 循环 连 
接 的 复杂 性 就 会 大 为 降低 。 这 将 把 代价 估计 减 小 到 B.+ BB 一 一 比 上 面 的 例子 降低 了 一 个 数量 
级 。 达 到 这 个 效果 的 方法 是 为 当前 在 内 存 中 的 r 的 页 中 的 所 有 元 组 输出 连接 的 结果 。 
如 果 我 们 可 以 把 对 s 的 扫描 次 数 减 小 为 r 的 每 一 页 进行 一 次 ， 那 么 我 们 能 不 能 进一步 把 这 
个 次 数 减 小 到 一 组 页 一 次 呢 ? 如 果 我 们 能 有 更 多 内 存 的 话 ， 那 么 答案 是 肯定 的 。 假 设 查询 处 
理 器 有 MM 页 主 存 缓冲 区 来 做 这 个 联结 。 我 们 可 以 为 外 层 循环 关系 r 分 配 M-2 页 ， 为 内 层 循 环 关 
系 s 分 配 一 页 ， 而 把 最 后 一 页 留 作 输 出 缓冲 区 。 这 个 过 程 在 图 13-6 中 做 了 描述 。 





r 的 输入 缓冲 区 





图 13-6 SRR ORE 
块 代 大 循环 连接 的 代价 可 以 用 类 似 前 例 的 方法 进行 估算 :外 层 循环 r 只 扫描 一 次 ， 代 价 是 
B 次 页 传输 ， 对 于 r 的 每 M-2 个 页 才 扫描 关系 s 一 次 ， 即 ff]. 因而， 代价 除去 把 输出 写 


进 磁盘 的 代价 ) EB +p | 二 |。 在 我 们 的 例子 中 ， 如 果 M=102， 那 么 这 个 代价 将 减 小 到 


1000+100 x 10=2000。 如 果 在 外 层 循 环 中 扫描 较 小 的 关系 s， 那 么 代价 将 会 更 低 ， 即 
100+100 x 10=1100 (或 者 假设 每 次 页 输入 /输出 花费 10ms ， 那 么 需要 11 秒 ) 一 一 相对 于 最 初 的 
简单 实现 的 代价 10 已 经 减 小 了 很 多 。 

2. eB] de BA RE E | | 

下 一 个 方法 是 使 用 索引 。 如 果 r 和 s 中 在 属性 4 和 2 上 匹配 的 元 组 的 数目 相对 文件 的 大 小 来 
说 比较 小 的 话 ， 那 么 利用 这 个 技术 会 取得 特别 好 的 结果 。 

假设 关系 s 在 属性 8 上 有 索引 ， 那 么 我 们 不 是 在 内 层 循 环 中 扫描 s， 而 是 使 用 索引 找 出 匹配 
的 元 组 : 
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foreach t € r do { 
use the index on B to find all tuples t' € s such that 
t[A] = t'[B]; output (t,t') 

} 


ATH IREAARAHM, RIES EMH IKONS CETERE. fs 
中 匹配 元 组 的 数目 也 是 要 考虑 的 因素 。 

如 果 素 引 是 B* 树 ， 那 么 找到 s 中 匹配 元 组 的 第 一 个 叶子 节点 的 代价 是 2 ~ 4， 这 依赖 于 关系 
的 大 小 。 在 基于 散 列 的 索引 中 ， 如 果 很 好 地 选择 散 列 函数 的 话 ， 那 么 这 个 代价 大 约 是 1.2。 下 
一 个 问题 是 需要 多 少 次 输入 /输出 操作 来 取得 s 中 的 匹配 元 组 ， 这 个 答案 依赖 于 匹配 元 组 的 数目 
UA BR SE BEAT AE ER BE 

ULES LAER BEY, ABZ HORST AAT DC Me 72 TE EB A St A 
的 数目 一 样 多 。 所 以 非 聚 牧 索 引 对 于 索引 幅 套 循环 联结 并 不 是 很 有 用 ， 除 非 匹配 元 组 的 数目 
很 小 〈 比 如， 如 果 B 是 s 的 候选 键 )。 对 于 聚 灸 索引 来 说 ， 所 有 匹配 元 组 通常 处 于 同一 个 或 者 相 
邻 的 磁盘 块 中 ， 所 以 检索 它们 所 需要 的 输入 /输出 的 数目 通常 是 1 或 者 2。 因 此 ， 在 聚 入 索引 的 
情况 下 ， 这 个 代价 估计 是 

Bet (pt 1), 

这 里 p 是 检索 B* 树 索引 的 叶子 节点 或 者 找 出 散 列 索 引 正确 的 桶 所 需要 的 输入 /输出 的 数目 
(我 们 假设 索引 不 是 和 数据 文件 集成 的 ， 而 且 所 有 的 匹配 元 组 都 能 放 进 一 页 中 ， 这 就 是 为 什么 
会 有 ! 的 原因 )。 在 非 聚 饶 索 引 的 情况 下 ， 这 个 代价 是 


P. +(p+u)xT, 


这 里 k 是 对 于 r 中 每 个 元 组 来 说 s 中 匹配 元 组 的 平均 数目 。 

我 们 再 回 到 我 们 的 例子 ， 把 这 个 代价 和 块 嵌 套 循环 联结 的 代价 作 一 个 比较 。 假 设 p 是 2 
(我 们 的 关系 很 小 ) ， 那 么 在 聚 馆 索 引 的 情况 下 的 代价 为 1000 + 3 x 10 000 = 31 000 一 一 这 比 块 
代 套 循环 中 的 代价 要 大 得 多 。 然 而 ， 如 果 我 们 在 和 嵌 套 循环 中 把 r 和 s 互 换 ， 那 么 索引 俯 套 循环 
和 块 从 套 循环 的 代价 就 很 接近 了 : 100 + 3 x 1000 = 3100 和 1100。 

在 这 个 例子 中 ， 索 引 看 起 来 对 于 块 嵌 套 循 环 是 不 起 什么 作用 的 。 那 为 什么 要 考虑 索引 
NE? 这 是 因为 索引 循环 有 一 个 很 重要 的 性 质 : 代价 不 容易 受 内 层 关 系 大 小 的 影响 ， 这 可 以 从 
上 面 的 公式 中 看 出 。 所 以 ， 如 果 我 们 在 内 层 循 环 中 使 用 了 s， 它 的 大 小 增长 到 10 000 页 
(100 000 个 元 组 )， 那 么 块 贬 套 循环 联结 的 代价 就 增长 到 1000 + 10 000 x 10 = 101 000 次 页 传 
输 。 相 比 之 下 ,索引 区 套 循环 联结 的 代价 的 增长 比较 适当 : 1000 + 3 x 10 000 = 31 000。 因 而 ， 
索引 联结 在 联结 的 关系 比较 大 ， 并 且 一 个 比 另 一 个 大 很 多 的 时 候 会 取得 比较 好 的 效果 。 


13.4.2 排序 -合并 联结 


排序 -合并 的 基本 思想 是 首先 对 每 个 关系 在 连接 属性 上 排序 ， 然 后 使 用 各 种 合并 过 程 来 找 
出 匹配 的 元 组 ， 即 同时 扫描 两 个 关系 ， 比 较 联 结 属性 。 当 找到 匹配 元 组 的 时 候 ， 就 把 联结 后 
的 元 组 加 入 结果 中 。 然 而 ， 这 样 做 的 实际 过 程 有 点 细致 。 我 们 在 图 13-7 中 给 出 了 这 一 算法 。 
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输入 : 在 属性 A 上 排 好 序 的 关系 5; 在 属性 B 上 排 好 序 的 关系 s 
输出 : roas 


Result := {} / 初始 化 结果 
tr := getFirst(r) / 得 到 第 一 个 元 组 
ts := getFirst (s) 
while !eof(r) and !eof(s) dof 
while !eof(r) && t [A] < t,[B] do 


tr := getNext (r) i 得 到 下 一 个 元 组 
while !eof(s) and t, [A] > t,[B] do 
ts := getNext (s) 
if t [A] = ts[B] = c then { 1/ 对 于 某 个 常数 
Result := (oA-c(r) x obg-c(s)) U Result; 
tr := the next tuple t € r where t[A] > c;} 


} 
return Result; 





图 13-7 排序 -合并 联结 的 合并 步 又 


根据 图 中 所 示 ， 算 法 中 的 合并 步骤 过 程 如 下 : 扫描 关系 r 和 s， 直 到 找到 属性 A 和 B 上 的 匹 
配 元 组 为 止 。 当 找到 相应 的 元 组 以 后 ， 就 把 匹配 元 组 的 所 有 可 能 的 组 合 ( 币 卡 儿 积 ) 加 入 结 
RP 

我 们 现在 根据 页 传输 的 数目 来 估计 排序 -合并 联结 的 代价 。 显 然 ， 我 们 必须 为 排序 关系 r 
和 s 付 出 代价 : 2B, logarnBr | +2B,[1logew-wBs ] (AMT eh x TBE). TIER 
的 代价 比较 细致 。 初 看 起 来 ， 似 乎 只 要 扫描 一 次 r 和 s 就 可 以 了 。 然 而 ， 如 果 我 们 不 能 把 oh- (r) 
Flos- (s) 都 放 进 内 存 中 ， 那 么 计算 笛 卡 儿 积 可 能 要 对 子 关系 0s-. (s) 做 多 次 扫描 。 计 算 这 个 乘 
积 的 最 好 方法 是 使 用 块 嵌 套 循环 联结 。 这 里 ， 页 传输 的 实际 数目 依赖 于 这 些 子 关系 的 大 小 和 
可 用 内 存 的 数量 。 然 而 在 通常 情况 下 ， 匹 配 的 子 关系 可 以 放 进 内 存 ， 这 就 可 以 避免 对 关系 s 做 
多 次 扫描 (例如 ， 如 果 A 和 B 是 键 )。 

对 于 我 们 的 实例 来 说 ， 我 们 在 块 中 的 关系 大 小 如 下 : B=1000，B,=100， 用 于 联结 操作 
的 缓冲 区 有 102 页 。 这 意味 着 s 的 排序 可 以 在 200 次 页 传输 中 完成 ,Fr 的 排序 可 以 在 
2 x 1000 x | logioi1000 | ， 即 4000 次 页 传输 中 完成 。 合 并 还 要 进行 一 次 扫描 (假设 匹配 元 组 
都 可 以 放 进 (M-1)/2 个 页 中 ， 所 以 连接 它们 并 不 涉及 额外 的 扫描 )。 因 此 ， 整 个 联结 应 该 要 
花费 5300 次 页 传输 。 实 际 上 ， 合 并 可 以 在 外 部 排序 算法 的 最 后 阶段 进行 (就 像 之 前 对 于 基于 
排序 的 投影 所 做 的 那样 一 一 具体 内 容留 作 练 习 13.9)。 在 这 种 情况 下 ， 排 序 - 合 并 联结 花费 了 
4200 次 页 传输 。 

在 这 个 特殊 的 情况 中 ， 块 嵌 套 循环 算法 看 起 来 优 于 排序 -合并 算法 。 然 而 ， 只 就 索引 侈 套 
循环 方法 来 说 ， 排 序 -合并 的 渐进 行为 优 于 块 风 套 循环 的 。 当 r 和 s 的 大 小 增长 时 ， 块 嵌 套 循环 
的 代价 呈 二 次 方 增长 ， 即 OB.B,)， 而 排序 -合并 联结 的 代价 的 增长 要 缓慢 得 多 (假设 像 上 面 
讨论 的 os-.(r) 和 os-e(s) 都 很 小 )， 即 O (BlogB, + BslogB,)。 


13.4.3 散 列 联结 
计算 联结 r 5 4-s s 的 一 个 方法 是 预 处 理 关 系 r 和 s， 以 使 可 能 匹配 的 元 组 位 于 相同 的 或 者 临 
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近 的 页 中 。 进 行 这 样 的 预 处 理 后 就 不 需要 对 内 层 循环 关系 做 重复 扫描 了 ， 这 也 是 上 面 讨论 的 
排序 -合并 技术 的 基本 思想 。 然 而 ， 排 序 只 是 一 种 可 能 的 预 处 理 技 术 。 除 此 之 外 ， 我 们 还 可 以 
使 用 散 列 来 保证 匹配 元 组 彼此 之 间 的 位 置 很 接近 。 我 们 之 前 使 用 过 这 个 技术 ， 那 时 候 我 们 需 
要 把 重复 元 组 〈 因 为 投影 或 者 集合 运算 而 引起 的 ) 放 到 彼此 靠近 的 位 置 。 显 然 ， 识 别 重 复 的 
问题 是 我 们 现在 面 对 的 这 个 问题 的 一 种 特殊 情况 : 识别 一 个 或 多 个 属性 有 着 相同 值 的 元 组 
(如 上 面 的 A 和 B )。 图 13-8 说 明了 这 一 思想 。 





r 








图 13-8 散 列 联结 


散 列 联结 方法 首先 把 每 个 输入 关系 散 列 到 散 列表 中 去 ， 这 里 r 在 属性 A 上 散 列 ，s 在 属性 B 
上 散 列 。 这 样 做 的 结果 是 r 和 s 中 可 能 匹配 的 元 组 被 放 进 了 同一 个 桶 中 。 

在 第 二 个 阶段 ， 连 接 每 个 桶 的 r 部 分 和 s 部 分 以 产生 最 后 的 结果 。 如 果 两 个 部 分 都 可 以 放 
进 内 存 ， 那 么 完成 所 有 这 些 联 结 的 代价 就 是 对 r 和 s 进 行 单 遍 扫 描 的 代价 。 如 果 桶 对 于 内 存 来 
说 太 大 了 ， 那 么 可 以 尝试 其 他 的 联结 技术 。 通 常 在 这 种 情况 下 ， 在 属性 A 上 使 用 不 同 的 散 列 函 
数 来 对 每 个 桶 的 r 部 分 作 进一步 划分 。 然 后 扫描 相应 桶 的 s 部 分 。 在 这 个 过 程 中 ,使 用 新 的 散 
列 函数 来 在 属性 B 上 散 列 s 的 每 个 元 组 ， 并 确定 r 中 匹配 的 元 组 。 

假设 每 个 桶 都 可 以 放 进 内 存 ， 那 么 联结 r 和 s 的 代价 就 是 对 这 些 表 做 三 次 扫描 。 必 须 输 入 r 
和 s， 必 须 输 出 得 到 的 桶 (对 每 个 关系 作 两 次 扫描 ) ， 然 后 必须 输入 每 个 桶 来 找 出 匹配 的 元 组 
(对 每 个 关系 作 一 次 扫描 一 一 回忆 一 下 我 们 没有 把 最 后 的 输出 步骤 包含 在 这 个 代价 中 ) 。 在 我 
们 的 实例 中 ， 代 价 是 3300 次 页 传输 ， 这 比 块 嵌 套 循环 的 代价 要 高 ， 但 是 散 列 联结 的 渐进 行为 
要 更 优 。 实际 上 ， 如 果 在 算法 第 一 阶段 产生 的 每 个 散 列 桶 都 可 以 放 进 内 存 中 ， 那 么 代价 相对 r 
和 s 的 大 小 来 说 是 线性 的 。 这 使 得 散 列 联结 在 迄今 为 止 所 讨论 的 所 有 方法 中 是 最 好 的 。 然 而 ， 
要 认识 到 散 列 联结 在 很 大 程度 上 依赖 于 散 列 函数 的 选择 ， 并 且 很 容易 被 不 合适 的 数据 而 破坏 。 
(如 果 所 有 的 元 组 都 被 散 列 到 同一 个 桶 中 将 会 怎么 样 呢 ? ) 另外 ， 散 列 联结 只 能 用 于 等 值 联结 
中 ， 所 以 散 列 联结 对 于 更 为 普遍 的 联结 条 件 (如 不 等 ) 就 不 适用 了 。 


13.5 多 关系 联结 


我 们 在 11.7 节 中 讨论 了 联结 索引 ， 并 把 它们 用 在 计算 联结 中 。 计 算 形 如 p544-s q 的 联结 的 
算法 首先 对 联结 索引 进行 扫描 ， 取 出 rid 可 以 在 索引 项 中 找到 的 元 组 。 


实际 的 计算 实质 上 类 似 于 索引 循环 联结 ， 在 外 层 循 环 中 扫描 P， 只 是 我 们 使 用 联结 索引 来 
定位 q 的 元 组 ， 而 不 是 用 q 的 在 属性 B 上 的 通常 索引 。 在 这 种 情况 下 ， 联 结 索 引 相 比 其 他 索引 
类 型 的 优势 在 于 不 需要 对 它 进行 搜索 ;因为 所 有 匹配 元 组 已 经 在 彼此 之 间 相 联系 了 ， 所 以 可 
以 简单 地 扫描 索引 ， 取 得 匹配 元 组 的 rid 对 ， 最 后 联结 元 组 。 

关于 联结 索引 的 思想 可 以 扩展 到 多 关系 联结 上 ， 这 里 要 创建 索引 来 把 多 于 两 个 元 组 的 rid 
联系 起 来 。 例 如 ， 在 3 路 联结 px4qmar 中 ,联结 索引 包含 了 形 如 <p, q, r> 的 三 元 组 ， 这 里 p 是 关 
系 p 中 元 组 的 rid，q 是 q 中 匹配 元 组 的 rid，r 是 r 中 匹配 元 组 的 rid。 按 rid 的 升序 来 对 三 元 组 进行 
排序 ， 首 先 考 虑 的 是 索引 的 第 一 个 字段 ， 然 后 是 第 二 个 字段 ， 然 后 是 第 三 个 (索引 也 可 能 是 
B+). 

有 了 这 样 的 索引 ， 可 以 用 扫描 联结 索引 的 简单 循环 来 计算 联结 。 对 于 索引 中 的 每 个 三 元 
组 <p, q, r>， 取 回 与 rid 为 p、q 和 r 相 应 的 元 组 。 因 为 索引 首先 在 第 一 个 字段 上 排序 ， 所 以 可 以 
在 对 索引 和 关系 p 的 单 次 扫描 中 进行 联结 。 然 而 ， 可 能 要 多 次 存 取 关系 q 和 r。 实 际 上， 如果 N 
是 对 于 p 中 每 个 元 组 来 说 q 中 匹配 元 组 的 平均 数目 ，M 是 对 于 p 中 每 个 元 组 来 说 r 中 匹配 元 组 的 
平均 数目 ， 那 么 为 了 计算 联结 可 能 要 检索 q 的 |p| x NUT, r 的 |p| x M 页 。 

多 路 联结 索引 对 于 加 速 所谓 的 星 型 联结 的 处 理 特别 有 用 ， 星 型 联结 是 联机 分 析 处 理 
(OLAP， 见 第 19 章 ) 中 常用 的 联结 类 型 。 

星 型 联结 (star join) LAMPS ona PPS cona, F2 cona; … 的 多 路 联结 ， 这 里 每 个 cond 是 只 
涉及 r 和 zr 的 属性 的 联结 条 件 。 换 句 话说 ， 没 有 条 件 能 把 r 和 mr 的 元 组 直接 联系 起 来 ， 所 有 的 匹 
配 都 是 通过 r 的 元 组 来 完成 的 。 星 型 联结 的 一 个 例子 如 图 13-9 所 示 ， 这 里 “卫星 ”关系 COURSE、 
TEACHNG 和 STUDENT 是 用 等 值 联结 条 件 和 “恒星 ”关系 TRANSCRIPT 联 结 的 ， 这 些 联结 条 件 没 有 
把 卫星 关系 的 属性 彼此 匹配 。 


Course TEACHING 









STUDENT 





图 13-9 星 型 联结 

多 路 联结 索引 适合 用 于 计算 星 型 联结 的 一 个 原因 是 星 型 联结 的 联结 索引 比 通常 的 多 路 联 
结 (练习 13.13) 的 联结 索引 更 容易 维护 。 另 外 ， 使 用 联结 索引 计算 通常 的 多 路 联结 的 代价 很 
大 。 考 虑 联结 r pa r, pa mr pa … Da ry, 假设 N 是 对 于 r 中 每 个 元 组 来 说 匹配 r, 中 元 组 的 平均 数 
目 。 那 么 ， 根 据 类 似 于 对 三 路 联结 的 分 析 ， 计算 联结 索引 可 能 需要 存 取 |r| x Nxn 个 页 。 
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幸运 的 是 ， 星 型 联结 有 着 更 为 有 效 的 方法 。 在 [O'Neil and Graefe 1995] 中 描述 的 一 种 方法 
利用 了 在 11.7.2 节 中 介绍 的 位 图 联结 索引 。 我 们 对 每 个 部 分 连接 r; za r 不 是 用 涉及 n 个 关系 的 
一 个 联结 索引 ， 而 是 用 一 个 位 图 联结 索引 5;。 每 个 6: 是 <v, bitmap> 对 的 集合 ， 这 里 v 是 ri 中 一 个 
元 组 的 rid， 当 且 仅 当 r 中 第 i 个 元 组 与 用 v 表 示 的 rj 的 元 组 联结 时 ，bitmap 在 第 ;个 位 置 上 是 1。 然 
后 我 们 可 以 扫描 6;， 再 对 所 有 的 位 图 进行 逻辑 或 运算 。 这 使 我 们 得 到 了 r 中 所 有 可 以 和 r; 中 某 
些 元 组 联结 的 元 组 的 rid。 在 得 到 每 个 卫星 关系 r;(i=1, …, n) 的 这 样 的 逻辑 析 取 的 位 图 后 ， 我 
们 可 以 对 这 些 位 图 进行 逻辑 与 运算 来 得 到 r 中 可 以 和 每 个 rm 中 某 些 元 组 联结 的 所 有 元 组 的 rid。 
换 句 话说， 这 个 过 程 删 去 了 r 中 不 参与 星 型 联结 的 所 有 元 组 。 原 理 是 只 会 剩 下 少量 元 组 ， 所 以 
可 以 利用 像 嵌 套 循环 那样 的 原始 技术 来 计算 联结 ， 而 代价 却 不 大 。 

主要 的 商用 数据 库 管 理 系 统 厂 商 (如 IBM 的 DB/2，Oracle 的 Oracle 8i 和 Microsoft 的 SQL 
Server) 的 最 新 版 本 都 支持 联结 索引 和 星 型 联结 优化 。 


13.6 计算 聚合 函数 


通常 在 查询 中 计算 聚合 函数 〈 像 AVG 或 者 COUNT) 涉及 对 查询 输出 作 完整 的 扫描 。 这 里 
唯一 的 问题 是 在 有 GROUP BY attrs 语 句 时 聚合 的 计算 问题 。 问 题 又 一 次 减 小 到 找到 根据 某 些 
属性 的 值 来 划分 元 组 的 有 效 技术 。 我 们 到 目前 为 止 已 经 确定 了 三 种 这 样 的 技术 。 

.排序 

T 
“一 索引 

这 三 种 技术 都 提供 了 存 取 由 GROUP BY 子 句 指定 的 元 组 的 分 组 的 有 效 方法 。 所 剩 下 的 就 
是 对 这 些 分 组 的 成 员 元 组 应 用 聚合 函数 。 


13.7 调 优 问题 : 对 物理 数据 库 设计 的 影响 


应 用 程序 设计 者 如 何 把 关系 运算 的 计算 技术 知识 翻译 成 更 好 的 系统 设计 呢 ? 他 们 能 够 起 
作用 的 一 个 领域 是 物理 数据 库 设计 。 尽 管 通常 由 数据 库 管理 系统 来 决定 如 何 组 织 数据 ， 但 是 
它 也 可 以 从 数据 库 设 计 者 那里 得 到 提示 。 考 虑 到 我 们 的 讨论 ， 特 别 感 兴趣 的 提示 是 索引 的 声 
明 。 尽 管 SQL 标准 没有 涉及 这 一 领域 ， 但 是 大 多 数 数据 库 管理 系统 厂商 允许 用 户 指定 要 被 索 
引 的 属性 、 索 引 的 类 型 ( 散 列 、B* 树 ) 以 及 索引 是 否 是 聚 秘 的 。 可 以 裁剪 这 些 声明 以 便 适 合 
在 每 个 特定 的 安装 时 期 望 的 查询 的 特定 组 合 。 

为 了 说 明 这 一 思想 ， 考 虑 TRANSCRIPT 关 系 (参见 图 4-5) ， 并 假设 大 多 数 的 查询 是 在 属性 
Semester 上 的 选择 和 联结 。 这 时 ， 最 好 的 策略 是 要 求 数据 库 管理 系统 在 那个 属性 上 创建 聚 灸 
索引 。B* 树 索引 保证 可 以 快速 找到 满足 任意 特定 选择 (即使 是 对 于 范围 选择 ) 的 索引 叶子 。 
因为 索引 是 聚 秘 的 ， 所 以 可 以 只 用 少数 的 几 次 页 传输 来 检索 实际 的 关系 元 组 。 另 外 ， 当 数据 
库 管 理 系统 需要 在 Semester 上 作 联 结 时 ， 它 可 以 使 用 排序 -合并 联结 。 因 为 关系 在 这 个 属性 上 
已 经 排 过 序 (因为 索引 是 聚 簇 的 )， 所 以 算法 的 排序 步 又 的 主要 部 分 就 不 会 产生 什么 开销 了 。 
最 后 ， 因 为 表 是 动态 的 ， 所 以 对 ISAM 组 织 来 说 应 该 优先 使 用 B* 树 。 假 设 还 要 在 StudId 属 性 上 
做 选择 和 联结 。 不 可 能 针对 StudId 属 性 提交 范围 查询 ， 所 以 使 用 二 级 散 列 索引 是 合适 的 。 
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对 于 更 加 有 意思 的 场景 (仍然 涉及 TRANSCRIPT 关 系 ) ， 假 设 最 频繁 的 存 取 路 径 是 通过 
Studld 和 CrsCode 的 组 合 ( 即 大 多 数 查 询 使 用 这 个 路 径 )， 较 少 用 到 的 路 径 是 通过 Semester。 显 
然 ， 我 们 必须 在 <StudId, CrsCode> 上 创建 一 个 索引 ， 在 Semester 上 创建 另 一 个 索引 。 然 而 ， 
问题 是 哪 一 个 索引 应 该 是 聚 氮 的 ? 初 看 一 下 ， 似 乎 <Studld, CrsCode> 上 的 索引 应 该 是 聚 秘 的 ， 
因为 这 是 到 达 关 系 主 要 的 存 取 路 径 。 然 而 ， 仔 细 看 一 下 这 个 关系 的 语义 就 使 我 们 确信 尽管 
<StudId, CrsCode> 不 是 这 个 关系 的 候选 键 ， 但 是 在 这 两 个 属性 上 一 致 的 TRANSCRIPT 记 录 的 数 
目 在 几乎 所 有 的 情况 下 都 是 1 一 一 只 有 当 学 生 重修 了 一 门 课程 的 时 候 ， 这 个 数字 才 可 能 大 于 1。 
而 且 不 可 能 针对 这 一 对 属性 提出 范围 查询 ， 所 以 B* 树 索引 的 开销 看 起 来 并 不 是 很 合理 一 一 散 
列 索 引 可 能 是 这 种 情况 下 最 好 的 解决 方法 。 另 一 方面 ，Semester 上 豪 比 的 B'! 树 索引 可 以 在 很 
大 程度 上 提高 在 那个 属性 上 选择 和 联结 的 效率 ， 它 是 二 级 存 取 路 径 的 一 个 很 好 的 选择 9 。 


13.8 参考 书目 


在 [Blasgen and Eswaran 1977] 中 讨论 了 关系 运算 符 的 基于 排序 的 计算 技术 ， 在 [DeWitt et al.1984, 
Kitsuregawa et al. 1983] 中 讨论 了 基于 散 列 的 技术 。 在 [Graefe 1993, Chaudhuri 1998] 中 可 以 找到 计算 关系 
运算 符 技 术 的 简介 和 其 他 的 参考 资料 。 在 [Valduriez 1987] 中 研究 了 使 用 联结 索引 来 计算 多 关系 联结 的 内 
A, [O Neil and Graefe 1995, O'Neil and Quass 1997] 中 讨论 了 在 位 图 索引 的 帮助 下 计算 各 种 关系 运算 
符 的 技术 。 


13.9 练习 


13.1 考虑 用 非 罕 簇 的 B* 树 来 做 外 部 排序 。 假 设 R 表 示 每 个 磁盘 块 上 的 数据 记录 的 数目 ，F 表 示 数 据 文件 
中 块 的 数目 。 估 计 这 样 的 排序 过 程 的 代价 (表示 为 R 和 F 的 函数 )。 把 这 个 代价 和 基于 合并 的 外 部 
排序 的 代价 进行 比较 。 考 虑 R=1、10 和 100 的 情况 。 

13.2 假设 在 初始 扫描 (在 这 里 删除 了 元 组 分 量 ) 的 过 程 中 ， 原 来 关系 的 大 小 的 缩小 率 为 因子 a<1， 估 
计 基 于 排序 的 投影 的 代价 。 

13.3 考虑 投影 运算 符 基于 散 列 的 计算 方法 。 假 设 所 有 桶 的 大 小 都 基本 相同 ， 但 是 不 能 放 进 主 存 。 设 N 是 
内 存 页 中 散 列表 的 大 小 ，5 是 页 中 初始 关系 的 大 小 ，a<1 是 因为 投影 而 导致 的 减 小 因子 。 佑 计 为 计 
算 投影 而 需要 向 磁盘 传输 的 和 从 磁盘 传输 的 页 的 数目 。 

13.4 举例 说 明 TRANSCRIPT 关 系 (4-5) 的 实例 和 属性 序列 <StudId, Grade> 上 的 散 列 函数 ， 这 个 散 列 函 
数 可 以 把 rsuaaseneser (TRANSCRIPT) 中 两 个 相同 的 元 组 发 送 到 不 同 的 散 列 桶 中 去 。( 这 表明 这 样 的 基 
于 散 列 的 存 取 路 径 不 能 用 于 计算 投影 。) 

13.5 存 取 路 径 的 选择 度 理论 上 的 最 小 值 显然 是 包含 涉及 到 的 关系 运算 符 的 输出 的 页 的 数目 。 当 涉及 选 
择 或 者 投影 运算 符 时 ， 存 取 路 径 的 选择 度 的 最 合理 的 理论 上 界 是 多 少 ? 

13.6 基于 13.3.2 节 中 的 讨论 ， 给 出 何 时 存 取 路 径 将 覆盖 投影 、 并 和 差 运算 符 的 使 用 的 准确 定义 。 

13.7 考虑 表达 式 


Osrudid=666666666 A Semester='F1995' A Grade="A' (TRANSCRIPT) 
假设 存在 下 面 的 存 取 路 径 : 
。 在 StudId 上 的 非 聚 簇 的 散 列 索引 


O 注意 ,这 种 情况 下 在 主键 <StudId, CrsCode, Semester> 上 的 主 索 引 可 能 不 是 聚 徐 的 。 
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这 些 存 取 路 径 中 ， 哪 个 路 径 有 着 最 合理 的 选择 度 ， 哪 个 路 径 的 选择 度 最 差 ? 把 最 差 的 存 取 路 径 

(在 上 面 三 种 中 ) 的 选择 度 和 文件 扫描 的 选择 度 作 一 比较 。 

用 下 面 的 方法 计算 r p< 。-s s 的 代价 。 

-KEHA 

。 块 做 套 循环 

* 25 RAM 

这 里 r 有 2000 个 页 WM LA207F TH, sH50007 HR, PALASAH, SATARE 

结 的 内 存 数量 是 402 页 。 

在 排序 -合并 联结 s cq r 中 ,合并 阶段 中 的 额外 扫描 看 起 来 是 没有 必要 的 。 我 们 应 该 能 够 在 排序 

算法 的 最 后 合并 阶段 中 匹配 s 和 r 的 元 组 。 具 体 设计 这 一 算法 。 

估计 用 排序 -合并 联结 来 计算 r p< 。-s s 所 需要 传输 的 页 的 数目 ， 假 设 : 

。r 的 大 小 是 1000 页 ， 每 页 上 有 10 个 元 组 ; s 的 大 小 是 300 页， 每 页 上 有 20 个 元 组 。 

* 用 于 计算 这 个 联结 的 内 存 缓冲 区 的 大 小 是 10 页 。 

eras ( 见 图 13-7) 中 匹配 元 组 的 笛 卡 儿 积 是 用 块 谷 套 循 环 联 结 来 计算 的 。 

*r[A] 有 100 个 不 同 的 值 ，sLUB1] 有 50 个 不 同 的 值 。 这 些 值 或 多 或 少 平均 地 分 布 在 这 些 文件 中 ， 所 以 
Onze (T) 的 大 小 《c Er[A]) 不 会 随 c 有 大 的 变化 。 

本 章 讨论 的 计算 联结 的 方法 都 涉及 等 值 联结 。 讨 论 计 算 像 r pq aa s 这 样 的 不 等 值 联结 问题 的 适用 

性 。 

考虑 关系 模式 R(A,B)， 它 具有 下 面 的 特性 : 

*。 元 组 的 总 数目 : 1000000, 

。 每 页 有 10 个 元 组 。 

。 属 性 A 是 候选 键 ， 在 1 ~ 1 000 000 之 间 变 化 。 

° EA LAR ASR RB ES. 

。 属 性 BE 有 100 000 个 不 同 的 值 。 

。 在 B 上 的 散 列 索引 。 

对 于 下 面 每 种 建议 的 方法 来 说 ， 佑 计 计 算 下 面 每 个 查询 所 需要 传输 的 页 的 数目 : 

‘oao 顺序 扫描 ; 在 A 上 有 索引 。 

。GA>aooAA<2oAB-s: 在 A 上 有 索引 ; 在 B 上 有 索引 。 

dasna: 顺序 扫描 ; 在 A 上 有 索引 在 B 上 有 索引 。 

设计 对 于 多 路 星 型 联结 的 联结 索引 进行 增 量 维护 的 算法 。 

设计 使 用 联结 索引 的 联结 算法 。 定 义 又 鞭 联 结 索引 (在 二 分 联结 的 情况 下 有 三 种 可 能 的 情况 ! ) 

的 概念 ， 并 考虑 聚 艇 对 联结 算法 的 影响 。 





第 14 章 查询 优化 概述 


本 章 是 通常 用 于 数据 库 管 理 系 统 的 关系 查询 优化 技术 的 概述 。 本 章 的 目的 并 不 是 要 把 你 
培养 成 数据 库 管理 系统 的 实现 者 ， 而 是 想 让 你 成 为 更 好 的 应 用 程序 设计 者 或 者 数据 库 管理 员 。 
就 像 了 解 用 于 关系 代数 的 计算 枝 术 的 知识 有 助 于 更 好 地 进行 物理 设计 一 样 ， 了 解 查 询 优化 的 
原则 有 助 于 编写 更 有 可 能 被 查询 优化 器 改善 的 SQL 查询 。 

关系 查询 优化 是 使 用 相对 简单 的 启发 式 搜索 算法 来 处 理 广泛 的 计算 复杂 性 的 一 个 很 好 的 
例子 。 在 [Garcia-Molina et al. 2000] 中 可 以 找到 关于 这 个 主题 更 为 全 面 的 讨论 。 


14.1 查询 处 理 概 述 


当 用 户 提 交 一 个 查询 的 时 候 ， 首 先 由 数据 库 管 理 系 统 的 解析 器 来 解析 这 个 查询 。 解 析 器 
验证 这 个 查询 的 语法 ， 并 使 用 系统 目录 来 决定 属性 引用 是 否 正确 。 例 如 ，TRANSCRIPT.Student 
不 是 一 个 正确 的 引用 ， 因 为 关系 TRANSCRIPT 并 没有 Student 这 个 属性 。 同样， 把 AVG 操 作 符 应 
用 于 CrsCode 属 性 也 与 这 个 属性 的 类 型 不 相 匹 配 。 

因为 SQL 查询 是 声明 性 的 ， 而 不 是 过 程 性 的 ， 所 以 它 并 不 指定 任何 特定 的 实现 。 因 而 ， 
必须 首先 把 解析 过 的 查询 转换 为 关系 代数 表达 式 ， 然 后 可 以 直接 使 用 第 13 章 中 给 出 的 算法 来 
计算 它 。 就 像 6.2.1 节 所 解释 的 那样 ， 下 面 这 个 典型 的 SQL 查询 : 


SELECT DISTINCT TargetList . 
FROM REL Vy:.., REL, Vn (14.1) 
WHERE Condition 


通常 被 翻译 成 下 面 的 关系 代数 表达 式 : © 
WrargetList (Ocondition’ (REL, XX REL,)) ( 14.2) 
这 里 ，Condition 是 Condition 从 SQL 语法 转换 到 关系 代数 表达 式 的 形式 。 例 如 ，WHERE 子 名 


T.Semester = 'F1995' AND P.Id = T.ProfId 
AND T.CrsCode = C.CrsCode 


可 翻译 成 选择 条 件 
Semester = 'Fi995' AND Id = ProfIQ 
AND TEACHING.CrsCode = CouRSE.CrsCode 


但 是 ， 上 面 从 SQL 直接 进行 翻译 而 产生 的 代数 表达 式 (14.2) 可 能 要 花费 很 长 时 间 (确实 
的 ! ) 来 计算 . 一 方面 ， 它 包含 有 笛 卡 儿 积 ， 所 以 联结 四 个 含 100 个 块 的 关系 的 将 产生 含 10 
个 块 的 中 间 关 系 ， 假 定 磁盘 速度 是 10ms/ 页 ， 那 么 用 50 小 时 才 仅 仅 能 把 它 全 部 写 出 去 。 即 使 我 
们 设法 把 笛 卡 儿 积 转换 成 等 值 联结 〈 就 像 本 章 后 面 所 解释 的 那样 )， 我 们 仍然 要 花费 很 长 的 时 


日 ”为 了 简化 符号 ， 我 们 忽略 在 第 卡 儿 积 中 一 些 属性 可 能 需要 重 命名 的 情况 。 
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间 转 换 上 面 的 查询 ( 几 十 分 钟 )。 查 询 优 化 器 (query optimizer) 的 作用 就 是 要 把 这 个 时 间 降 
到 几 秒 钟 (对 很 复杂 的 查询 来 说 降 到 几 分 钟 )。 

典型 的 查询 优化 器 结合 使 用 启发 式 算法 和 代价 估计 方法 来 选择 查询 执行 计划 。 因 而 ， 查 
询 优 化 器 的 两 个 主要 组 成 部 分 是 查询 执行 计划 生成 器 (query execution plan generator) 和 计 
划 代 价 估计 器 (plan cost estimator)。 查 询 执行 计划 (query execution plan) 可 以 看 作 是 一 个 
关系 表达 式 ， 这 个 表达 式 中 关系 操作 符 的 每 次 出 现 都 附加 有 具体 的 计算 方法 ( 即 我 们 在 第 13 
章 中 所 说 的 存 取 路 径 )。 因 而 ， 查 询 优化 器 的 主要 任务 是 产生 一 个 查询 执行 计划 来 计算 给 定 的 
关系 表达 式 。 然 后 ， 这 个 计划 可 以 传递 给 查询 执行 计划 解释 器 ， 这 个 软件 组 件 根 据 给 定 的 计 
划 直 接 负责 计算 查询 。 查 询 处 理 的 总 体 体系 结构 如 图 14-1 所 示 。 





Do 


查询 计划 解释 器 和” 
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图 14-1 数据 库 管理 系统 查询 处 理 的 典型 体系 结构 


14.2 基于 代数 等 价 的 启发 式 优化 


用 于 计算 关系 查询 的 启发 式 算法 (ABB) 是 基于 简单 的 观察 ， 比如 联结 较 小 的 关系 优 
于 联结 较 大 的 关系 ， 等 值 联结 优 于 笛 卡 儿 积 ， 在 一 次 关系 扫描 中 计算 若干 操作 优 于 在 多 次 扫 
描 中 计算 同样 多 次 操作 。 大 多 数 这 样 的 启发 式 算法 都 可 以 用 关系 代数 转换 的 形式 来 表达 ， 它 
把 一 个 表达 式 转换 成 另 一 个 不 同 但 等 价 的 表达 式 。 并 不 是 所 有 的 转换 都 会 产生 优化 的 等 价 表 
达 式 ， 有 时 它们 产生 “不 太 有 效 ” 的 表达 式 。 然 而 ， 关系 转换 与 其 他 转换 一 起 产生 总 体 上 更 
好 的 表达 式 。 

我 们 现在 给 出 一 些 用 于 查询 优化 器 的 启发 式 转换 。 

1. 基于 选择 和 投影 的 转换 

° Geondy con (R) = Ocona, (Gcona, (R))。 这 个 转换 称 为 选择 的 级 联 (cascading of selection) 。 

它 本 质 上 并 不 是 优化 ， 但 是 它 在 与 其 他 转换 一 起 使 用 时 很 有 用 (参见 下 面 关 于 通过 联结 
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来 推动 选择 和 投影 的 讨论 )。 

* Ocond, (Ocona, (R)) = Ocond, (Geconal (R))。 这 个 转换 称 为 选择 的 交换 (commutativity of 

selection )。 像 级 联 一 样 ， 它 在 与 其 他 转换 一 起 使 用 时 很 有 用 。 

“如 果 attr C attr ， 则 ro (R)= Narr (om (有 ))。 这 个 等 价 称 为 投影 的 级 联 ( cascading of 

projection) ， 主 要 是 与 其 他 的 转换 一 起 使 用 。 

*。 如 果 attr 包 含 了 用 于 conrd 的 所 有 属性 ， 则 ruvr (Gcona (R)) = cond (Marr (R))。 这 个 等 价 称 为 选 

择 和 投影 的 交换 (commutativity of selection and projection )。 它 通常 用 作 通 过 联结 操作 

符 推动 选择 和 投影 的 一 个 准备 步骤 (下 面 将 做 描述 ) 。 

笛 卡 儿 积 和 联结 的 转换 

用 于 笛 卡 儿 积 和 联结 的 转换 就 是 这 些 提 作 符 常 用 的 交换 律 和 结 合 律 。 

* 有 PdS=S aR 

eR :za (S qdT)=(R caS) czdT 

*RxS=S<xR 

*Rx(SxT)=(RxS8)xT 

这 些 规则 在 与 各 种 嵌 套 循环 计算 策略 一 起 使 用 时 是 很 有 用 的 。 就 像 在 第 13 章 中 看 到 的 那 
样 ， 在 外 层 循环 中 扫描 较 小 的 关系 通常 比较 好 ， 上 面 的 规则 有 助 于 把 关系 调整 到 适当 的 位 置 
上 去 。 例 如 ，BIGGER >< SMALLER 可 以 改写 成 SMALLER D< BIGGER， 这 就 直观 地 对 应 决定 在 外 
层 循环 中 使 用 SMALLER 的 查询 优化 器 。 

交换 律 和 结合 律 〈 至 少 在 联结 这 种 情况 下 ) 可 以 在 计算 多 关系 联结 时 减少 中 间 关 系 的 
Khe Ain, So T 可 能 比 R x S 小 得 多 ， 在 这 种 情况 下 计算 (S T) x R 可 能 比 计算 
(R œ S) x T 的 输入 /输出 操作 更 少 。 分 配 律 和 结合 律 规 则 可 以 用 于 把 后 面 的 表达 式 转换 成 
前 面 的 表达 式 。 

实际 上 ， 交 换 律 和 结合 律 主 要 用 于 同一 个 查询 可 能 存在 多 个 可 选 的 计算 计划 的 情况 。 涉 
及 N 个 关系 联结 的 查询 可 能 有 T(N) x NI 个 只 是 处 理 联 结 的 查询 计划 ， 这 里 的 T(N) 是 有 N 个 叶 
子 节点 的 不 同 二 叉 树 的 数目 。( NI 是 N 个 关系 的 排列 的 数目 ， T(N) 是 为 一 个 特定 的 排列 加 上 
括 弧 的 不 同方 式 的 数目 。 ) 这 个 数目 即使 对 于 很 小 的 N 来 说 也 会 增长 得 非常 迅速 并 且 很 大 。 。 
类 似 的 结果 对 于 其 他 可 交换 和 可 结合 的 关系 也 是 成 立 的 (比如 并 )， 但 是 我 们 关注 的 是 联结 
因为 它 的 计算 代价 最 大 。 

查询 优化 器 的 任务 就 是 估计 这 些 计 划 的 代价 (这些 计划 的 代价 可 能 会 有 很 大 的 不 同 )， 并 
选择 一 个 “好 的 ”计划 。 因 为 计划 的 数目 很 大 ， 所 以 找到 一 个 好 的 计划 的 时 间 可 能 比 直接 计 
算 查询 所 花 的 时 间 还 要 多 (进行 10“ 次 输入 /输出 比 15! 次 内 存 操作 还 要 快 )。 为 了 让 查询 优化 
变 得 实用 一 些 ， 优 化 器 通常 只 是 检查 所 有 可 能 的 计划 的 一 个 小 的 子 集 ， 所 以 它 的 代价 估计 最 
多 也 是 近似 的 。 因 此 ， 查 询 优 化 器 很 可 能 没有 找到 最 优 的 计划 ， 而 实际 上 只 是 找到 “合理 的 ” 
计划 。 换 名 话说， 在 “查询 优化 器 ”中 的 “优化 ”并 不 总 是 满足 需要 ， 因 为 它 并 不 足以 描述 
数据 库 管理 系统 的 体系 结构 的 某 个 组 件 所 完成 的 事情 。 


O 当 N=4 时 ，T7(4) 是 5， 所 有 计划 的 数目 是 120。 当 N=5 时 ，7(5) 是 14， 所 有 计划 的 数目 是 1680。 
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2. 通过 联结 和 箭 卡 儿 积 推动 选择 和 投影 
© ad (R x S)=R bicona S。 当 cond 与 R 和 S 的 属性 都 相关 的 时 候 使 用 这 个 规则 。 这 种 启发 
式 方 法 的 基础 就 是 认为 不 应 该 物化 笛 卡 儿 积 ， 选 择 必须 和 笛 卡 儿 积 组 合 使 用 ， 并 且 应 该 
使 用 计算 联结 的 技术 。 只 要 创建 R x $ 的 一 行 就 应 用 选择 条 件 ， 我 们 可 以 节省 一 遍 扫描 ， 
并 且 避 免 存 储 很 大 的 中 间 关 系 。 
*。 如 果 用 于 cond 的 属性 都 属于 R， 则 ceou (R x S) = Oona (R) xS。 这 个 启发 式 方法 基于 这 样 
的 想法 : 如 果 必 须 计算 笛 卡 儿 积 ， 那 么 我 们 也 应 该 让 所 涉及 的 关系 尽 可 能 地 小 。 通 过 把 
选择 下 推 到 R， 我 们 希望 在 R 应 用 到 交 积 之 前 就 减少 它 的 大 小 。 
。 如 果 cond 中 的 属性 都 属于 R， 则 ccws(R OF S)= Oona (R) pq S。 这 里 的 原理 和 对 于 笛 卡 儿 
积 的 方法 的 原理 是 一 样 的 。 计 算 联结 的 代价 可 能 非常 大 ， 我 们 必须 努力 减 小 所 涉及 的 关 
系 的 大 小 。 注 意 ， 如 果 cond 是 比较 条 件 的 合 取 ， 那 么 我 们 可 以 把 每 个 合 取 分 量 分 开 推 到 
R 或 者 S 上 去 ， 只 要 在 分 量 中 命名 的 属性 只 属于 一 个 关系 。 
。 如 果 attributes (R) 2 attr' 2 (attr Nattributes (R))， 那 么 rowr(R x S) = Narr (Manr (R) x S). 
X Eattributes (R) 表 示 R 的 所 有 属性 的 集合 。 这 个 规则 的 原理 是 通过 把 投影 推进 笛 卡 儿 
积 ， 我 们 可 以 减 小 其 中 一 个 操作 数 的 大 小 。 在 第 13 章 中 ， 我 们 看 到 联结 操作 (“x ”是 
一 个 特例 ) 的 输入 /输出 复杂 性 是 和 涉及 的 关系 的 页 数 成 比例 的 。 因 此 ， 较 早 地 应 用 投 
影 可 以 减少 计算 又 积 所 需 传递 的 页 的 数目 。 
。 如 果 attributes (R) 2 attr' 2 (attr N attributes (R))， 并 且 attr' 包 含 在 cond 中 提 到 的 R 的 
所 有 那些 属性 ， 那 么 rowr (R Kona S) = Mater Marr’ (R) Keon S)。 这 里 潜在 的 好 处 是 和 又 积 
一 样 的 。 另 一 个 重要 的 需求 是 attr' 必 须 包 含 在 conad 中 提 到 的 R 的 所 有 那些 属性 。 如 果 这 
些 属性 中 的 一 部 分 被 投影 掉 了 ， 那 么 表达 式 rw (R) OS cond S 将 会 出 现 句 法 错误 。 这 个 需 
求 在 笛 卡 儿 积 的 情况 下 是 没有 必要 的 ， 因 为 在 笛 卡 儿 积 中 不 涉及 联结 条 件 。 
通过 联结 和 又 积 推动 选择 和 投影 的 规则 在 与 级 联 gc 和 规则 结合 使 用 时 特别 有 用 。 例 如 ， 
考虑 表达 式 ao hooncs (Rx S)， 这 里 ci 涉及 R 和 S 的 属性 ，c? 只 涉及 及 的 属性 ，cs 只 涉及 $S 的 属性 。 
我 们 通过 首先 级 联 选 择 ， 然 后 把 它们 下 推 ， 最 后 消除 笛 卡 儿 积 来 把 这 个 表达 式 转换 成 能 够 更 
有 效 计算 的 表达 式 : 
Gey AcyAc3 (R x S) = Ga (Oe (Oc, (R x S))) =0,, (ao (R) * ao (S)) = Oo R) Ps, aa (S) 


我 们 可 以 用 类 似 的 方式 来 优化 涉及 投影 的 表达 式 。 例 如 ， 考 虑 revw (R Seong S)。 假 设 attr， 
是 R 中 属性 的 一 个 子 集 ， 使 attr 2 attr N attributes (R)，artri 包 含 cord 中 的 所 有 属性 。 假 定 
attr? 是 对 于 S 来 说 类 似 的 集合 ， 那 么 ， | 

Nattr (R OS cong S) = Water (Tar (R PS cond S)) = Mater (Manr (R) PS cong S) = 
Matir (Mattry (Manr, R) P< cong (S)) = Toor (Maser, (R) D< cong Tarr, (S)) 

这 样 得 到 的 表达 式 更 为 有 效 ， 因 为 它 联结 的 是 较 小 的 关系 。 

使 用 代数 等 价 规则 

通常 上 面 的 代数 规则 用 于 把 关系 代数 表达 的 查询 转换 成 比 最 初 的 查询 更 好 的 表达 式 。 这 
里 “更 好 ”这 个 词 并 不 总 是 真 的 ， 因 为 用 来 指导 转换 的 标准 就 是 启发 式 的 。 实 际 上 ， 在 下 一 
节 中 ， 我 们 将 看 到 用 建议 的 转换 并 不 一 定 产生 最 好 的 结果 。 因 而 代数 转换 步骤 的 结果 应 该 产 
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生 一 组 候选 查询 ， 然 后 再 用 下 一 节 中 讨论 的 代价 估计 技术 进行 进一步 检查 。 这 里 给 出 了 应 用 
代数 等 价 方法 的 典型 的 启发 式 算法 。 

1) 使 用 选择 的 级 联 规则 来 打破 选择 条 件 的 连接 。 结 果 ， 将 单个 的 选择 转换 成 一 系列 的 选 
择 操 作 符 ， 然 后 可 以 单独 应 用 每 个 操作 符 。 

2) 上 一 个 步骤 将 会 使 通过 联结 和 笛 卡 儿 积 推动 选择 具有 更 多 的 自由 。 我 们 现在 可 以 使 用 
选择 的 交换 律 和 通过 连接 推动 选择 等 规则 来 尽 可 能 的 把 选择 传播 进 查 询 中 去 。 

3) 把 笛 卡 儿 积 操 作 和 选择 结合 起 来 形成 联结 。 就 像 在 第 13 章 中 看 到 的 那样 ， 计 算 联 结 有 
十 分 有 效 的 技术 ,但 是 可 以 改善 第 卡 儿 积 的 计算 的 方法 就 很 少 了 。 因 而 ， 把 这 些 乘 积 转换 成 
联结 可 以 节省 时 间 和 空间 。 

4) 使 用 联结 和 笛 卡 儿 积 的 分 配 律 来 重新 安排 联结 操作 的 顺序 。 这 里 的 目的 是 设法 得 到 一 
个 产生 最 小 的 中 间 关 系 的 顺序 。( 注 意 ， 中 间 关 系 的 大 小 直接 影响 到 开销 ， 所 以 减 小 它们 的 大 
小 会 加 速 查 询 的 处 理 速 度 。) 在 下 一 节 中 将 会 讨论 估计 中 间 关 系 大 小 的 技术 。 

5) 使 用 级 联 投影 和 把 它们 推进 查询 的 规则 来 尽 可 能 地 把 投影 传播 到 查询 中 去 。 这 可 以 通 
过 减 小 操作 数 的 大 小 来 加 速 联结 的 计算 。 

6) 找 出 可 以 在 同一 遍 扫描 中 处 理 的 操作 ， 以 节省 把 中 间 关 系 写 进 磁盘 的 时 间 。 这 一 技术 
称 为 管道 ， 将 在 下 一 节 中 进行 介绍 。 


14.3 估计 查询 执行 计划 的 代价 


、 就 像 前 面 定义 的 那样 ， 查 询 执行 计划 从 某 种 意义 上 说 就 是 关系 表达 式 ， 其 中 的 每 一 个 操 
作 都 附加 有 具体 的 计算 方法 ( 存 取 路 径 )。 在 这 一 节 中 ， 我 们 将 进一步 探讨 这 一 概念 ， 并 讨论 
计算 计划 (为 了 计算 查询 结果 ) 的 代价 的 方法 。 
为 了 讨论 的 方便 ， 我 们 把 查询 表示 成 树 。 在 查询 树 (query tree) 中 ， 每 个 内 部 节点 用 关 
系 操作 符 来 标记 ， 每 个 叶子 节点 用 关系 名 来 标记 。 一 元 关系 操作 符 只 有 一 个 孩子 ， 二 元 操作 
符 有 两 个 孩子 。 图 14-2 分 别 表示 了 对 应 下 面 等 价 关 系 表达 式 的 四 棵 查询 树 : 


TName ( Opepud = Cs' A Semester = P1994' ( PROFESSOR Dig = profa TEACHING ) ) (14.3) 
NName (Opepd='cs' (PROFESSOR ) Pig profid Osemester = ‘F1994 ( TEACHING ) ) (14.4) 
TName ( Osemester='F1994' ( ODeptld = 'cs' ( PROFESSOR) pqid = profiad TEACHING )) (14.5) 
TName (Opepud='cs' (PROFESSOR Paqia- profid Osemester = F1994 ( TEACHING) ) ) (14.6) 


关系 PROFESSOR 和 TEACHING 在 图 4-5 中 描述 过 。 
对 应 图 14-2a 的 表达 式 (14.3) 是 查询 处 理 器 从 下 面 的 SQL 查询 最 初生 成 的 。 


SELECT P.Name 

FROM PROFESSOR P, TEACHING T 

WHERE P.Id = T.ProfId AND T.Semester = 'F1994' (14.7) 
AND P.DeptId = 'CS' 


对 应 图 14-2b 的 第 二 个 表达 式 〈14.4) 是 从 第 一 个 表达 式 中 得 来 的 ， 即 像 前 一 节 的 启发 式 
规则 建议 的 那样 通过 联结 来 推动 选择 。 对 应 图 14-2c 和 14.2d 的 第 三 个 和 第 四 个 表达 式 是 从 
(14.3) 中 得 来 的 ， 它 们 只 是 把 选择 条 件 的 一 部 分 下 推 到 实际 的 关系 上 去 而 得 到 的 。 


PIÈ High temsk 





Tyame TName 
GDeptid='CS' A Semester="F1994’ | 
Id=ProfId 
bq oN 
Id=Profid 
ODeptid='Cs’ SSemester='F 1994’ 
PROFESSOR TEACHING PROFESSOR TEACHING 
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><] ><] 
Id=ProfId Id=ProfId 
6 ine 
Deptid='CS OSemester=F 1994" 
PROFESSOR TEACHING PROFESSOR _ TEACHING 
c) d) 


图 14-2 关系 表达 式 (14.3) ~ (14.6) 的 查询 树 


我 们 现在 来 用 各 种 查询 执行 计划 来 扩充 这 些 查询 树 ， 并 估计 每 棵 树 的 代价 。 

假定 下 面 的 信息 在 系统 目录 中 的 这 些 关 系 上 是 可 用 的 。 

e Professor 

大 小 : 200 页 ， 关于 50 个 系 中 的 教授 的 1000 个 记录 (5 个 元 组 /页 )。 

索引 : 在 Deptd 上 聚焦 的 2 级 B* 树 索引 ， 在 Id 上 的 散 列 索引 。 

e Teaching 

大 小 : 1000 个 页 ， 四 个 学 期 的 10 000 个 教学 记录 (10 个 元 组 /页 ) 。 

索引 : 在 Semester 上 聚焦 的 2 级 B* 树 索引 ， 在 Proffd 上 的 散 列 索引 。 

在 继续 之 前 ， 我 们 还 需要 另 一 个 信息 : 关系 PRoFEssog 中 属性 Ia 的 权重 和 关系 TEACHING 中 
属性 ProfId 的 权重 。 通 常 ， 关 系 r 中 属性 A 的 权重 (weight) 是 匹配 属性 4 的 不 同 值 的 元 组 的 平 
均 数 目 。 换 句 话 说， 权重 是 oa - vane (中 中 元 组 的 平均 数目 ， 这 里 的 “平均 ”是 就 ?中 4 的 所 有 值 
来 说 的 。 - 

各 种 属性 的 权重 通常 是 从 存储 在 系统 目录 中 的 静态 信息 中 导出 的 ， 并 由 数据 库 管理 系统 
来 维护 。 当 前 的 查询 优化 器 进一步 为 一 个 特定 属性 中 的 值 的 分 布 维护 了 柱状 图 。 关 于 对 于 给 
定 的 属性 值 来 说 有 多 少 元 组 可 能 被 选择 到 ， 柱 状 图 给 出 了 更 为 精确 的 信息 。 需 要 用 属性 权重 
来 估计 使 用 基于 索引 的 技术 计算 联结 的 代价 ， 以 及 在 我 们 的 例子 中 估计 所 有 操作 的 结果 的 大 
小 。 因 为 各 种 操作 的 中 间 结果 可 能 会 在 后 来 用 作 其 他 操作 符 的 输入 ， 所 以 知道 其 大 小 对 于 估 
计 每 个 具体 计划 的 代价 是 重要 的 。 
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回 到 我 们 的 例子 ， 我 们 首先 要 找到 属性 14 和 ProfId 的 实际 权重 。 对 于 PROFESSOR 中 的 属性 Id 
来 说 ， 权 重 必须 是 1， 因 为 Id 是 键 。 对 于 TeAcHING 中 的 Profld 的 权重 来 说 ， 我 们 假设 每 个 教授 
可 能 教 了 相同 数目 的 课程 。 因 为 有 1000 个 教授 和 10 000 个 教学 记录 ， 所 以 ProfId 的 权重 必须 大 
约 是 10。 现 在 我 们 来 考虑 图 14-2 中 的 四 种 情况 。 在 这 四 种 情况 中 ， 我 们 都 假设 有 51 页 的 缓冲 
区 来 计算 联结 ， 外 加 少量 的 内 存 来 存放 一 些 索引 块 (具体 的 数量 在 必要 的 时 候 将 会 指定 )。 

1. 情况 a: 没有 推动 选择 

计算 联结 的 一 种 可 能 方法 是 索引 嵌 套 循环 方法 。 例 如 ， 我 们 可 以 在 外 层 循环 中 使 用 较 小 
的 关系 PROFESSOR。 因 为 在 Id 和 Proffd 上 的 索引 不 是 聚 徐 的 ， 并 且 因 为 PRoFESsoR 中 的 每 个 元 组 
可 能 匹配 TEACHING 中 的 某 个 元 组 〈 通 常 每 个 教授 总 要 教 点 什么 ) ， 所 以 可 以 用 如 下 过 程 来 估计 
代价 。 

。 扫描 PROFESSOR 关 系 200 页 传输 。 

。 在 TEACHING 中 找 出 匹配 的 元 组 “我们 可 以 使 用 缓冲 区 中 的 50 页 来 存放 PRoFESsoR 关 系 的 

页 。 因 为 在 每 个 这 样 的 页 中 有 5 个 PROFESSOR 的 元 组 ， 又 因为 每 个 元 组 匹配 10 个 TEACHING 
元 组 ,所 以 PROFESSOR 关 系 的 50 页 的 块 平均 可 以 匹配 50 x 5 x 10=2500 个 TEAcHING 的 元 组 。 
因为 在 TEACHING 的 Profrd 属 性 上 的 索引 不 是 聚 簇 的 ， 所 以 不 对 从 其 中 检索 出 的 记录 Id 排 
序 。 结 果 ， 取 得 数据 文件 中 匹配 的 行 的 代价 (暂时 不 考虑 从 索引 中 取得 Id 的 代价 ) 就 可 
能 是 2500 页 传输 。 然 而 通过 首先 对 这 些 匹配 元 组 的 记录 Id 排 序 ， 我 们 可 以 保证 在 不 超过 
1000 页 的 传输 (TEACHING 关 系 的 大 小 ) 中 取得 这 些 元 组 (这 要 用 到 13.3.1 节 描述 的 技术 )。 
因为 这 个 技巧 必须 执行 四 次 (对 PROFESSOR 的 每 个 50 页 的 块 来 说 )， 所 以 取得 TEAcHING 中 
匹配 元 组 的 总 的 页 传输 的 数目 是 4000。 

。 搜 索索 引 ”因为 TEACHING 在 Profld 上 有 散 列 索引 ， 所 以 我 们 假设 每 次 索 引 搜 索 有 1.2 次 输 

入 /输出 。 对 于 每 个 ProfId 来 说 ,搜索 找 出 包含 所 有 匹配 元 组 (平均 10 个 ) 的 记录 Id 的 桶 。 

这 些 Id 可 以 在 一 次 输入 /输出 中 检索 到 。 因 此 ， 在 TEAcHING 中 元 组 的 1000 个 匹配 记录 Id 可 

以 以 每 次 输入 /输出 10 个 元 组 的 速度 来 检索 ， 总 共 要 1000 次 输入 /输出 。 对 所 有 元 组 进行 

索引 搜索 总 的 代价 是 1200。 

。 总 的 代价 5200 次 页 传输 。 

我 们 还 可 以 使 用 块 幅 套 的 循环 联结 或 者 排序 -合并 联结 。 对 于 利用 51 页 内 存 缓冲 区 的 块 出 
套 循环 来 说 ， 必 须 扫 描 4 次 内 层 关 系 TEACHING。 这 就 使 得 页 传输 的 数目 变 小 : 200+4 x 1000 = 
4200。 但 注意 ， 如 果 ProfId 的 权重 比较 低 ， 那 么 索引 柚 套 技术 和 块 侯 套 技术 之 间 的 区 别 就 很 大 
了 (练习 14.4)。 

联结 的 结果 将 有 10000 个 元 组 (因为 Id4 是 PRoFESssoR 的 键 ， 每 个 PROFESSOR 元 组 匹配 大 约 10 
个 TEACHING 元 组 )。 因为 每 个 TEAcHING 元 组 的 大 小 是 PRoFEssoR 元 组 大 小 的 两 倍 ， 所 以 得 到 的 
文件 将 会 比 TEACHING 大 50% 。 换 名 话说， 它 将 有 1500 页 。 

下 一 步 我 们 要 应 用 选择 和 投影 操作 符 。 因 为 联结 的 结果 没有 任何 索引 ， 所 以 我 们 选择 文 
件 扫 描 存 取 路 径 。 另 外 ， 我 们 可 以 在 同一 遍 扫描 中 应 用 选择 和 投影 。 依 次 检查 每 个 元 组 ， 如 
果 它 不 满足 选择 条 件 ， 我 们 就 丢弃 它 ， 如 果 它 满足 选择 条 件 。 我 们 就 丢弃 没有 在 SELECT 子 句 
中 命名 的 属性 ， 并 输出 结果 。 

我 们 可 以 把 联结 阶段 和 选择 /投影 阶段 分 开 处 理 ， 输 出 联结 的 结果 到 中 间 文 件 ， 然 后 输入 
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这 个 文件 来 做 选择 /投影 ， 但 是 有 一 个 更 好 的 办 法 。 通 过 使 这 两 个 阶段 交错 进行 ， 我 们 可 以 省 
去 与 创建 和 存 取 中 间 文 件 的 输入 /输出 操作 。 利 用 称 为 管道 (pipelining ) 的 技术 ， 联 结 和 选择 
/投影 可 以 作为 协同 例 程 来 操作 。 执 行 联结 阶段 直到 用 完 内 存 中 可 用 的 缓冲 区 为 止 ， 然 后 由 选 
择 / 投 影 接管 ， 清 空 缓冲 区 ， 输 出 结果 。 然 后 重复 联结 阶段 ， 填 满 缓 冲 区 ， 处 理 继续 进行 ， 直 
到 选择 /投影 输出 最 后 的 元 组 为 止 。 在 管道 中 ， 一 个 关系 操作 符 的 输出 “通过 管道 传送 ”到 下 
一 个 关系 操作 符 的 输入 ， 从 而 省 去 了 磁盘 上 的 中 间 结 果 。 

得 到 的 查询 执行 计划 如 图 14-3a 所 示 。 总 之 ， 使 用 块 嵌 套 循 环 策略 计算 这 个 计划 花费 了 
4200+a x 1500 页 输入 /输出 ， 这 里 1500 是 联结 的 大 小 ，o 是 0 ~ 1 之 间 的 一 个 数字 ， 它 是 因为 选 
择 和 投影 而 导致 的 减 小 因子 。 我 们 在 本 章 的 后 面 要 研究 估计 这 个 减 小 因子 的 技术 。 
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图 14-3 (14.3) 到 (14.6) 关系 表达 式 的 查询 执行 计划 

2. 情况 b: 全 部 推动 选择 
图 14-2b 中 查询 树 给 出 了 很 多 可 选 的 查询 执行 计划 。 首 先 ， 如 果 我 们 把 选择 下 推 到 树 的 叶 
子 节点 (关系 PROFESSOR 和 TEACHING)， 那 么 我 们 可 以 使 用 已 存 的 在 DeptIl4 和 Semester 上 的 B* 树 
索 3 | 计算 关系 Opepua ='CS' (PROFESSOR) Hl Osemestr =Fl%4 (TEACHING)。 然 而 ， 得 到 的 关系 就 没有 任何 
索引 了 .( 除 非 数据 库 管 理 系统 决 得 值得 创建 它们 )。 特 别 的 ， 我 们 不 能 利用 PRoFEsSsor.Id 和 
TEACHING.Profld 上 的 散 列 索 引 。 因 此 ， 我 们 必须 使 用 块 修 套 循环 或 者 排序 -合并 来 计算 联结 。 
然后 当 把 联结 的 结果 写 到 磁盘 上 的 时 候 ， 即 时 地 应 用 投影 到 联结 的 结果 上 。 换 句 话说， 我 们 
又 一 次 使 用 了 管道 来 把 应 用 投影 操作 的 开销 最 小 化 。 | 
我 们 估计 图 14-3b 中 所 示 的 计划 的 代价 ， 这 里 是 使 用 块 幅 套 循环 来 进行 联结 。 因 为 在 50 个 
系 里 有 1000 个 教授 ， 所 以 PROFESSOR 关 系 中 DeptId 的 权重 是 20。 因 此 ， Opeptid = cs) ( PROFESSOR ) 
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的 大 小 是 20 个 元 组 左右 ， 即 4 页 。TEACHING 中 Semester 的 权重 是 10000/4 = 2500 个 元 组 ， 即 250 
页 。 因 为 DeptIld 和 Semester 上 的 索引 是 诊 秘 的 ， 所 以 计算 选择 将 花费 4 次 输入 /输出 (来 存 取 这 
两 个 索引 ) +4+250 次 输入 /输出 (来 存 取 两 个 关系 中 符合 条 件 的 元 组 )。 
可 以 在 每 个 文件 的 一 遍 扫 描 中 进行 联结 操作 (因为 缓冲 区 可 以 容纳 整个 PRoFESSOR 关 系 )。 
因此 ， 总 的 代价 是 4+4+250+4+250=512。 
3. 情况 c: 推动 选择 到 PROFESSOR 关系 
对 于 图 14-2c 中 的 查询 树 ， 可 以 用 如 下 方法 构造 查询 执行 计划 。 首 先 ， 使 用 
PRoFESSOR.DeptId 上 的 B" 树 索引 计算 apepua = cs (PROFESSOR)。 就 像 在 情况 b 中 那样 ， 这 将 使 得 我 
们 在 随后 的 联结 计算 中 不 能 进一步 使 用 PRoFEssoR.Id 上 的 散 列 索引 。 然 而 和 情况 b 不 同 的 是 ， 
关系 TEACHING 保 持 不 变 ， 所 以 我 们 仍然 可 以 使 用 索引 伐 套 循环 (利用 在 TEACHING.Proffd 上 的 
索引 ) 来 计算 连接 。 其 他 的 可 能 是 块 嵌 套 循环 和 排序 -合并 联结 。 最 后 ， 我 们 可 以 利用 管道 伟 
输 联结 的 输出 到 选择 操作 符 pepua = rs， 并 在 同一 遍 扫描 中 应 用 投影 。 
上 面 的 查询 执行 计划 如 图 14-3c 所 示 。 我 们 现在 来 估计 这 个 计划 的 代价 。 
* Opepud = ‘cs: (PROFESSOR)。 有 50 个 系 ，1000 名 教授 。 因 此 ， 这 个 选择 的 结果 将 包含 大 约 20 
个 元 组 ， 即 4 个 页 。 因为 PRorEssoR.DeptId 上 的 索引 是 聚焦 的 ， 所 以 检索 这 些 元 组 应 该 花 
费 大 约 4 次 输入 /输出 。 索 引 搜索 将 会 为 2 级 B" 树 索引 花费 2 次 额外 的 输入 /输出 。 因 为 我 们 
想 把 选择 的 结果 通过 管道 输入 到 接 下 来 的 联结 步骤 ， 所 以 没有 输出 代价 。 
。 索 引 谋 套 循环 连接 。 我 们 使 用 前 面 选择 的 结果 并 把 它 直接 作为 输入 通过 管道 输出 给 联结 
这 里 要 考虑 的 一 个 重要 问题 是 ， 因 为 我 们 选择 的 是 利用 了 TEAcHING.ProfId 上 的 散 列 索引 
的 索引 妃 套 循环 ， 所 以 选择 的 结果 即使 很 大 也 不 需要 保存 在 磁盘 上 。 一 旦 选择 产生 足够 
多 的 元 组 来 填 满 缓冲 区 ， 我 们 就 可 以 马上 使 用 散 列 索引 把 这 些 元 组 和 匹配 的 PRoFESsoOR 
元 组 联结 起 来 ， 并 且 输 出 连接 后 的 元 组 。 然 后 我 们 重新 进行 选择 ， 并 再 次 填 满 缓冲 区 。 
和 以 前 一 样 ， 每 个 PROFESSOR 元 组 匹配 大 约 10 个 TEAcHING 元 组 ， 它 们 将 要 存储 在 一 个 桶 
里 。 所 以 ， 为 了 找 出 20 个 元 组 的 匹配 ， 我 们 不 得 不 搜索 索引 20 次 ， 每 次 搜索 的 代价 是 
1.2 次 输入 /输出 。 另 外 需要 200 次 输入 /输出 来 从 磁盘 上 取得 匹配 的 元 组 (因为 索引 是 非 
聚 徐 的 )。 总 之 ， 这 应 该 要 花费 1.2 x 20+200 = 224 次 输入 /输出 。 
站 的 代价 。 因 为 连接 的 结果 通过 管道 传输 给 下 一 个 选择 和 投影 ， 所 以 这 些 后 面 的 操作 就 
输入 /输出 来 说 并 不 花费 什么 。 因 此 ， 总 的 代价 是 4+2+224 = 230 次 输入 /输出 。 
4. 情况 d: 推动 选择 到 TEACHING 关 系 
这 种 情况 类 似 于 情况 c， 只 是 现在 将 选择 应 用 到 TEAcHING 而 不 是 PRoFEssoR。 因为 . 
TEACHING 上 的 索引 在 应 用 选择 后 就 丢失 了 ， 所 以 我 们 不 能 在 索引 的 嵌 套 循环 联结 的 内 层 循 环 
中 使 用 这 个 关系 。 然 而 ， 我们 可 以 在 索引 嵌 套 的 循环 联结 ( 它 在 内 层 循环 中 利用 了 
PROFESSOR.DeptId 上 的 散 列 索引 ) 的 外 层 循 环 中 使 用 它 。 这 个 联结 也 可 以 使 用 块 伐 套 循环 和 排 
合并 来 计算 。 在 这 个 例子 中 ， 我 们 选择 了 排序 合并 。 之 后 对 结果 应 用 选择 和 投影 可 以 像 前 
而 的 全 于 下 对 信用 道 来 完成 。 得 到 的 查询 计划 如 图 14-3d 所 示 。 
“Ks: 排序 阶段 。 第 一 步 是 在 Id 上 对 PRoFEssoR 进 行 排序 ， 在 ProfId 上 对 
Osemester = 'F1994 (TEACHING) 进 行 排序 。 
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。 为 了 对 PROFESSOR 进 行 排序 ， 我 们 必须 首先 对 它 进行 扫描 ， 创 建 排 序 的 运行 。 因 为 
PRoFEssoR 可 以 放 进 200 块 中 ， 所 以 将 会 有 200/50 = 4 个 排序 的 运行 。 因 此 ， 四 个 排序 
的 运行 的 创建 和 把 它们 排序 回 磁盘 要 花费 2 x 200 =400 次 输入 /输出 。 这 些 运 行 可 以 只 
在 一 遍 扫描 中 合并 ， 但 是 我 们 推 延 这 个 合并 ， 把 它 和 排序 合并 联结 二 的 合并 阶段 结合 起 
来 (如 下 所 示 )。 
。 为 了 对 Gsemester = 'F1994' (TEACHING HEATHER, 我 们 必须 首先 计算 这 个 关系 。 因为 
TEACHING 保 存 了 大 约 4 个 学 期 的 信息 ， 所 以 选择 的 大 小 约 为 10000/4=2500 个 元 组 。 因 
为 索引 是 聚 繁 的 ， 所 以 元 组 连续 地 存储 在 这 个 文件 的 250 个 块 中 。 因 此 选择 的 代价 大 
约 是 252 次 输入 /输出 操作 ， 其 中 包含 为 了 搜索 索引 所 做 的 2 次 输入 /输出 操作 。 
选择 的 结果 不 是 被 写 进 磁盘 。 每 次 内 存 中 的 50 页 缓冲 区 充满 的 时 候 ， 就 立即 对 
它 进 行 排序 以 产生 一 个 运行 ， 然 后 将 其 写 到 磁盘 上 去 。 用 这 种 方式 ， 我 们 创建 了 
250/50 = 5 个 排序 的 运行 。 这 要 花费 250 次 输入 /输出 。 
Osemester = 'F1994' (TEACHING) AS A LAR FR AIIS 77 FT LAE — ld FF 然而 ， 我 们 
不 是 单独 地 进行 这 个 操作 ， 而 是 把 这 一 步骤 和 联结 的 合并 步骤 (以 及 之 前 被 推 延 的 
排序 PRoFESSOR 的 合并 步骤 ) 结合 起 来 。 
。 联 结 : 合并 阶段 。 不 是 将 PROFESSOR 的 4 个 已 排序 的 运行 和 Gscemeswer = 'Fi994 (TEACHING) AY EL 
排序 的 运行 合并 到 两 个 已 排序 的 关系 中 去 ， 而 是 将 运行 直接 通过 管道 传输 到 排序 合并 联 
结 的 合并 阶段 ， 而 不 是 把 中 间 排 序 的 结果 写 到 磁盘 上 去 。 用 这 种 方法 ， 我 们 在 排序 这 些 
关系 的 时 候 把 最 终 的 合并 步骤 和 联结 的 合并 步骤 结合 起 来 。 
组 合 的 合并 为 PRoOFESSoR 的 每 个 已 排序 的 运行 使 用 了 4 个 输入 缓冲 区 ， 为 
Osemester = ml%4 (TEACHING) 的 每 个 已 排序 的 运行 使 用 了 5 个 输入 缓冲 区 ， 并 为 联结 的 结果 使 
用 一 个 输出 缓冲 区 。 选 择 元 组 p 和 p.Id 在 4 个 PROFESSOR 的 运行 的 头 中 最 低 的 值 ， 并 把 它 
和 元 组 tt.ProfId 在 5 个 与 gseneser = F1994'《(TEACHING) 对 应 的 运行 的 头 中 最 低 的 值 相 匹 配 。 
如 果 p.Id =t.ProfId， 那 么 p 和 t 就 从 运行 中 去 除 ， 它 们 的 联结 就 放置 在 输出 缓冲 区 中 。 如 
果 p.Id<t.ProfId， 那 么 就 丢弃 p; 否则 就 丢弃 t。 然 后 重复 这 个 过 程 直 到 用 完 所 有 的 输入 
ane 
合 合并 的 代价 是 读 取 两 个 关系 的 排序 运行 : 用 于 PROFESSOR 的 运行 的 200 次 输入 / 
输出 和 用 F Osemester = 'F1994' (TEACHING) 运 行 的 250 次 输入 /输出 。 f 
。 其 他 的 。 然 后 联结 的 结果 直接 通过 管道 传输 给 下 一 个 选择 〈 在 Deptd 上 ) 和 投影 (在 
Name t) 操作 。 因 为 不 用 把 中 间 结 果 写 到 磁盘 上 ， 所 以 这 些 阶段 的 输入 /输出 代价 为 零 。 
。 总 的 代价 。 将 以 上 各 个 操作 的 代价 求 和 ， 我 们 得 到 : 400+252+250+200+250 = 1352. 
最 佳 的 计划 
总 结 一 下 结果 ， 我 们 可 以 看 到 (在 考虑 到 的 那些 计划 中 ， 这 些 计划 只 是 所 有 可 能 的 计划 
的 一 小 部 分 ) 最 好 的 计划 是 计划 C。 这 里 ， 有 趣 的 是 ， 这 个 计划 优 于 计划 b， 即 使 计划 b 联 结 的 
是 较 小 的 关系 〈 因 为 选择 充分 下 推 了 )。 其 中 的 原因 是 ， 当 选择 下 推 到 TEAcHING 关 系 的 时 候 ， 
索引 丢失 。 这 又 一 次 说 明了 14.2 节 的 启发 式 规则 就 是 启发 性 的 。 尽 管 利用 它们 可 以 产生 更 好 
的 查询 执行 计划 ， 但 是 它们 必须 在 一 个 更 为 普遍 的 代价 模型 中 计算 。 
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14.4 估计 输出 的 大 小 


在 前 一 节 中 的 例子 ， 说 明了 对 各 种 关系 表达 式 的 输出 大 小 进行 精确 估计 的 重要 性 。 一 
表达 式 的 结果 作为 另 一 个 表达 式 的 输入 ， 输 入 的 大 小 对 于 计算 的 代价 有 着 直接 的 影响 。 为 了 
更 好 地 理解 这 样 的 估计 是 如 何 完成 的 ， 我 们 给 出 一 个 简单 的 技术 ， 这 个 技术 基于 以 下 的 假设 : 
所 有 的 值 在 关系 中 出 现 的 几率 是 相等 的 。 

对 每 个 关系 名 R 来 说 ， 系 统 目 录 可 以 包含 下 面 一 组 统计 信息 : 

*Blocks (R) 表 R 的 实例 占用 的 块 的 数目 。 

e Tuples (R) R 的 实例 中 元 组 的 数目 。 

e Values (R.A) R 的 实例 中 属性 4 的 不 同 值 的 数目 。 

。MaxVal (R.A) R 的 实例 中 属性 4 的 最 大 值 。 

e MinVal (R.A) R 的 实例 中 属性 4 的 最 小 值 。 

之 前 我 们 介绍 了 属性 权重 的 概念 ， 并 使 用 它 来 估计 选择 和 等 值 联结 的 大 小 。 我 们 现在 定 
义 更 为 普遍 的 概念 一 一 减 小 因子 。 考 虑 下 面 的 通用 查询 : 

SELECT TargetList 


FROM Ri Veee, Ry Vn 
WHERE Condition 


这 个 查询 的 减 小 因子 (reduction factor) 是 比率 


Tuples (结果 集 ) 
Tuples (Ri) x … x Tuples 


尽管 这 个 定义 看 起 来 是 循环 的 〈 为 了 找 出 减 小 因子 我 们 需要 知道 结果 集 的 大 小 )， 但 是 减 “ 
小 因子 容易 通过 归纳 查询 结构 来 估计 。 
我 们 假设 减 小 因子 因 查 询 的 不 同 部 分 而 彼此 独立 的 。 因 而 ， 


reduction (Query) = reduction (TargetList) x reduction (Condition) 


XE, reduction (TargetList) 是 因为 各 行 在 SELECT 子 句 中 的 属性 上 的 投影 而 导致 的 大 小 减 
My, reduction (Condition) 是 因为 去 掉 不 满足 Condition 的 行 而 导致 的 大 小 减 小 。 
如 果 Condition = Condition, AND Condition, JRA 


reduction (Condition) = reduction (Condition,) x reduction ( Condition, ) 


因而 ， 因 为 复杂 条 件 而 导致 的 大 小 减 小 可 以 根据 因为 那个 条 件 的 分 量 而 导致 的 大 小 减 小 
来 估计 。 

剩 下 的 是 估计 因为 SELECT 子 句 的 投影 和 WHERE 子 名 中 的 原子 条 件 而 导致 的 减 小 因子 。 
我 们 在 这 个 讨论 中 忽略 嵌 套 子 查询 和 聚合 。 


e reduction (R; A = value) = “Values (RA) ， 这 里 有 是 关系 名 ，4 是 Ri 中 的 属性 。 这 个 估计 是 
基于 均匀 假设 一 一 所 有 的 值 是 等 值 可 能 的 。 
1 


e reduction (R,.A = R,.B) = 一 一 一， 这 里 R 和 RR 是 关系 ， 
reduction ( vB) = Tax (Values RA) Values (RAy ， 这 里 Ri 和 R 是 关系 ，4 和 8 
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是 属性 。 使 用 均匀 假设 ,我 们 可 以 把 R; (Rj) 分 解 成 若干 子 集 ， 这 些 子 集 具有 以 下 性 质 : 
子 集 的 所 有 元 素 在 Ri.4 (RB) 上 有 着 相同 的 值 。 如 果 我 们 假设 Ri 中 有 Na ,个 元 组 ，R 中 
有 Na 个 元 组 ，R 中 的 每 个 元 素 匹 配 Rj 中 的 一 个 元 素 ， 那 么 我 们 可 以 得 出 结论 : 满足 条 件 
的 元 组 的 数目 是 Values (Ri4) x (Np, / Values (R;.A)) > (Nr, / Values (Rj-B)). 通常 ， 计 算 
减 小 因子 是 假设 (并 不 实际 ) 在 较 小 范围 内 的 每 个 值 匹配 较 大 范围 内 的 一 个 值 。 假 设 
RA 是 较 小 的 范围 ， 用 Nr, x Ne 来 除 这 个 表达 式 ， 就 得 到 减 小 因子 。 
MaxVal (R;.A) - value 

e reduction (R;.A > value) = Values (RAD 。 对 于 R,.4 < value 来 说 ,， 减 小 因子 也 可 

以 类 似 定义 。 这 些 估计 也 是 基于 这 样 假设 .所 有 的 值 都 是 均匀 分 布 的 。 


number — of — attributes (ZargetList) , m N 
number — of — attributes (R;) 。 这 里 为 了 简单 起 见 ， 我 们 


假设 所 有 的 属性 对 应 相等 的 元 组 大 小 。 
14.3 节 的 属性 Ri.A 的 权重 现在 可 以 用 碱 小 因子 的 概念 来 估计 : 
weight (R,.A) = Tuples (Ri) x reduction (R;.A = value) 


例如 ， 查 询 PROFESSOR.DeptId = value 的 减 小 因子 是 1/50， 因 为 有 50 个 系 。 因 为 PROFESSOR 
中 元 组 的 数目 是 1000， 所 以 PROFESSOR 中 属性 DeptId 的 权重 是 20。 
14.5 选择 计划 

在 前 一 节 中 ， 我 们 看 了 一 些 查询 执行 计划 ， 并 且说 明 如 何 计算 它们 的 代价 。 然 而 ， 我 们 
还 没有 给 出 产生 候选 计划 的 通用 技术 。 但 是 ， 可 能 的 计划 的 数目 会 非常 大 ， 所 以 我 们 需要 一 
种 有 效 的 方法 来 选择 相对 较 小 的 但 是 比较 符合 要 求 的 子 集 。 我 们 可 以 计算 每 一 个 计划 的 代价 ， 
然后 选择 最 好 的 。 在 此 过 程 中 至 少 涉及 三 个 主要 的 问题 。 

。 选 择 逻 辑 计划 。 

* 减 小 搜索 空间 。 

。 选 择 启发 式 的 搜索 算法 。 

我 们 依次 来 讨论 这 些 问 题 。 

1. 选择 运 辑 计划 

我 们 把 查询 执行 计划 定义 为 查询 树 ， 这 棵 树 的 每 个 内 部 结 点 都 附加 有 关系 实现 方法 。 因 
此 ， 构 造 这 样 的 计划 涉及 两 个 任务 : 选择 树 和 选择 现实 方法 。 选 择 正确 的 树 是 更 为 困难 的 工 
作 ， 因 为 涉及 的 树 的 数目 是 由 二 元 可 分 配 和 可 交换 的 操作 符 ( 如 联结 、 第 卡 儿 积 、 并 等 等 ) 
决定 的 ， 可 以 用 很 多 不 同 的 方式 来 处 理 。 我 们 在 14.2 节 中 提 到 的 其 中 N 个 关系 由 这 样 的 操作 符 
组 合 的 查询 树 的 子 树 可 以 有 T (N) xN! 种 方法 。 我 们 想 单独 处 理 这 种 指数 级 的 复杂 性 ， 所 
以 我 们 首先 关注 逻辑 查询 执行 计划 (logical query execution plan)， 它 通过 把 同一 种 的 连续 二 
元 操作 符 组 合 到 一 个 节点 ， 避 免 了 这 个 问题 ， 如 图 14-4 所 示 。 

不 同 的 逻辑 查询 执行 计划 是 通过 下 推选 择 和 投影 以 及 将 选择 和 第 卡 儿 积 组 合成 联结 而 利 
FAX (14.2) 的 “ 主 计 划 ” 创 建 的 。 所 有 可 能 的 逻辑 计划 中 只 有 一 部 分 用 来 做 进一步 的 考虑 。 
通常 ， 被 选中 的 计划 是 充分 推动 树 (因为 希望 它们 产生 最 小 的 中 间 结 果 ) 和 所 有 “几乎 是 


e reduction (TargetList)= 
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充分 推动 的 树 。 从 前 一 节 中 的 讨论 可 以 很 明显 地 看 出 后 一 种 情况 的 原因 : 下 推选 择 和 投影 到 
查询 树 的 叶子 节点 可 以 消除 在 联结 计算 中 使 用 索引 的 选择 。 
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图 14-4 把 查询 树 转换 成 逻辑 查询 执行 计划 

根据 这 个 启发 式 方法 ， 图 14-2a 的 查询 树 就 不 会 被 选中 ， 因 为 其 中 没有 推动 任何 东西 。 
14.3 节 说 明了 图 14-3b 中 的 充分 下 推 查询 计划 不 如 图 14-3c 中 的 几乎 充分 下 推 计 划 ( 它 有 着 最 小 
的 代价 估计 )。 在 这 个 例子 中 ， 所 有 的 连接 都 是 二 元 的 ， 所 以 图 14-4 所 示 的 转换 并 不 适合 。 

2. 减 小 搜索 空间 

选择 了 候选 的 逻辑 查询 执行 计划 后 ， 查 询 优化 器 必须 决定 如 何 来 计算 涉及 可 交换 和 可 分 
配 的 操作 符 的 表达 式 了 。 例 如 ， 图 14-5 说 明了 几 种 可 选 的 但 是 等 价 的 把 组 合 多 个 关系 的 逻辑 
计划 中 可 交换 和 可 分 配 的 节点 a 转换 成 查询 树 5p、c 和 d 的 方 革 。 


><] ><] 
A B C D >q JN 
wo PN ELT A B c D 
a) 逻辑 查询 计划 b) 等 价 的 查询 树 
NN 
A >< D4 
\ a 
LA >< ~ 
八 D ><] c LA 
B C i-> A B A 
c) 另 一 个 等 价 的 查询 树 l d 第 三 种 等 价 查询 树 : 左 深 查询 树 


图 14-5 逻辑 计划 和 三 种 等 价 查询 树 ; 
对 应 逻辑 查询 计划 中 一 个 节点 的 所 有 可 能 的 等 价 查询 ( 子 ) 树 空间 是 二 维 的 。 首 先 ， 
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我 们 必须 选择 想 要 的 树 的 形状 ( 即 我 们 忽略 节点 的 标号 )。 例 如 ， 图 14-5 的 树 有 不 同 的 形 
状 ， 其 中 d 是 最 简单 的 。 这 样 形状 的 树 被 称 为 左 深 查询 树 (left-deep query tree )。 树 的 形 
状 对 应 涉及 可 分 配 和 可 交换 的 操作 符 的 关系 子 表达 式 的 加 括号 的 特定 方法 。 因 而 ， 图 14-5a 
中 的 逻辑 查询 执行 计划 对 应 于 表达 式 A%BmCmD， 而 查询 树 bp、c 和 d 分 别 对 应 于 表达 式 
(A%B) œ% (CD), Aù (BC) mMD 和 ((AmMB) C) KD. ARER LAE X 
如 (= ((E 0< En) D< E) 9…) mm 的 代数 表达 式 。 

查询 优化 器 通常 为 查询 树 决 定 一 个 特定 的 形状 : 左 深 。 这 是 因为 即使 有 了 固定 的 树 形 ， 
查询 优化 器 还 是 要 做 大 量 的 工作 。 给 定 图 14-5d 的 左 深 树 ， 仍然 有 4! 个 可 能 的 排序 联结 的 方 
法 。 例 如 ，((BD) DIC) mA 是 图 14-5d 男 一 种 联结 的 排序 ， 它 会 产生 不 同 的 左 深 查询 执行 
计划 。 所 以 ， 如 果 为 4!1 个 查询 执行 计划 计算 代价 估计 ， 那 么 看 起 来 不 会 花费 很 多 时 间 ， 但 是 
想 一 想 ， 如 果 要 估计 10! 或 者 12! 甚至 16! 个 计划 的 代价 ， 那 要 花费 多 少时 间 。 顺 便 提 一 下 ， 
所 有 商用 查询 优化 器 最 多 处 理 16 个 左右 的 联结 。 

除了 减 小 搜索 空间 常见 的 需要 以 外 ， 选 择 左 深 树 而 不 选 形 如 图 14-5b 的 树 的 另 一 个 原因 是 
管道 传输 。 例 如 ， 在 图 14-5d 中 我 们 可 以 首先 计算 Ax%B ， 然 后 把 结果 通过 管道 传输 给 和 C 的 下 
一 个 联结 。 第 二 个 联结 的 结果 也 可 以 在 树 中 向 上 进行 管道 传输 ， 而 不 需要 将 中 间 结 果 物 化 到 
磁盘 。 能 够 这 样 做 对 于 大 关系 来 说 是 很 重要 的 ， 因 为 从 一 个 联结 得 到 的 中 间 输 出 可 能 会 很 大 。 
例如 ， 如 果 关 系 A、B 和 C 的 大 小 是 1000 页 ， 那 么 中 间 的 关系 可 能 会 达到 10' 个 页 ， 只 是 在 与 D 
连接 后 。 在 磁盘 中 存储 这 样 的 中 间 结 果 的 开销 是 巨大 的 。 

3. 启发 式 的 搜索 算法 

.选择 左 深 树 已 经 把 搜索 空间 的 大 小 由 极 大 减 小 到 很 大 。 下 一 步 我 们 必须 给 左 深 树 的 叶子 
节点 分 配 关系 。 因 为 有 N! 种 分 配方 法 ， 所 以 估计 所 有 的 代价 仍然 是 很 难处 理 的 事情 。 因 此 ， 
需要 利用 启发 式 的 搜索 算法 ， 通 过 查看 整个 搜索 空间 中 极 小 的 一 部 分 来 找 出 合理 的 计划 。 一 
个 这 样 的 算法 是 基于 动态 编程 ， 并 应 用 于 多 个 商用 系统 中 (如 DB2)。 我 们 下 面 要 解释 这 个 算 
法 主要 的 思想 。[Griffiths-Selinger et al. 1979] 给 出 了 具体 内 容 。[Wong and Youssefi 1976] 描 述 
了 另 一 种 不 同 的 启发 式 搜索 算法 ， 这 一 算法 应 用 于 Igres (过 去 很 有 影响 力 的 一 个 数据 库 管理 
系统 )。 

动态 编程 启发 式 搜索 算法 的 一 个 简化 版 本 如 图 14-6 所 示 。 它 首先 通过 评估 用 于 计算 N 元 联 
HED: DI Ey (每 个 E 都 是 1 元 关系 表达 式 ) 的 每 个 参数 的 所 有 计划 的 代价 ， 从 而 创建 一 个 左 
深 查 询 树 。 这 些 就 被 称 为 1 元 关系 计划 。 注 意 ， 每 个 瑟 都 可 能 有 若干 这 样 的 计划 (因为 有 不 同 
的 存 取 路 径 ， 如 一 个 人 可 能 使 用 一 遍 扫 描 ， 另 一 个 人 可 能 使 用 索引 ) ， 所 以 1 元 关系 计划 的 数 
目 可 能 是 N 或 者 更 大 。 所 有 这 些 计划 中 最 好 的 〈 即 那些 具有 最 小 代价 的 ) 可 以 扩展 到 二 元 关系 
计划 ， 然 后 三 元 关系 计划 等 等 。 为 了 扩展 最 好 的 一 元 关系 计划 p (为 了 明确 起 见 ， 假 定 p 是 已， 
的 一 个 计划 ) 为 二 元 关系 计划 ，p 和 除了 Ei 的 计划 之 外 (因为 我 们 已 经 选择 p 作 为 Ei 的 计划 ) 
的 每 个 一 元 关系 计划 做 联结 。 然 后 我 们 计算 所 有 这 些 计 划 的 代价 ， 保留 最 好 的 二 元 计划 。 通 
过 把 g 和 每 个 一 元 关系 计划 (除了 用 于 Ei 和 Ei 的 计划 ， 因 为 它们 已 经 在 g 中 考虑 进去 了 ) E 
结 而 扩展 每 个 最 好 的 二 元 计划 4 为 一 组 三 元 关系 计划 。 再 强调 一 次 ， 为 下 一 个 阶段 只 保留 具有 
最 低 代 价 的 计划 。 这 个 过 程 继 续 下 去 ， 直 到 与 逻辑 计划 E1854…P4Ew 对 应 的 左 深 表 达 式 完全 构 
造 出 来 为 止 。 
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Input: A logical plan El oa... oa Ey 
Output: A “good” left-deep plan (... ((Ei pa E;,) bd En) Da. .) pq Ein 


1-Plans := all 1-relation plans 
Best := all 1-relation plans with lowest cost 
for (i :=1;i < N; i++) do 
// Below, "sit denotes join marked with an implementation method, meth* ` 
Plans := { best ®e 1-plan | best € Best; 1-plan € 1-Plans, where 
1-plan is a plan for some Ej; that has‘not 
been used so far in best } 
Best := { plan | plan € Plans, where plan has the lowest cost } 
end 、 
return Best; 





图 14-6 查询 执行 计划 的 启发 式 查找 


我 们 用 实例 查询 (14.7) 来 说 明 整 个 过 程 。 首 先 查询 处 理 器 生成 许多 合理 的 逻辑 计划 ， 在 
我 们 的 情况 下 ， 这 些 计 划 是 图 14-2b 的 充分 下 推 的 树 和 两 棵 部 分 下 推 树 c 和 d。 

图 14-2 所 示 的 树 的 形状 是 左 深 ,但 是 每 棵 这 样 的 树 有 两 个 查询 执行 计划 与 之 对 应 : 它们 
的 差别 在 于 联结 中 关系 的 顺序 不 同 。 我 们 从 图 14-2c 的 逻辑 计划 开始 ， 来 考虑 用 图 14-6 的 算法 
生成 的 查询 执行 计划 。 l 

对 于 Gpepud = 'cs' (PROFESSOR) 的 一 元 关系 计划 可 以 使 用 下 面 的 存 取 路 径 : 一 遍 扫 描 ， 
PROFESSOR.DeptId 上 的 育 伺 索引， 或 者 二 元 搜索 (因为 PRoFESsoR 在 DeptId 上 排序 )。 最 好 的 
计划 使 用 这 个 索引 ， 所 以 保留 它 。 对 于 表达 式 TEAcHING 只 需 扫描 。 我 们 现在 有 了 两 个 一 元 关 
系 计 划 。 在 下 一 个 迭代 中 ， 算 法 扩展 选中 的 一 元 计划 到 二 元 计划 。 这 等 于 生成 两 个 表达 式 
Opeptid = cs (PROFESSOR)DPqid-prord TEACHING 和 TEACHING D< profid = 1¢ Opepud = 'cs' (PROFESSOR), FERRE 
在 每 个 联结 中 使 用 的 计算 策略 。 我 们 在 14.3 节 估计 了 前 一 个 表达 式 不 同 的 计划 ， 并 得 出 结论 : 
索引 嵌 套 的 循环 联结 是 最 好 的 。 不 能 用 相同 的 方法 计算 第 二 个 表达 式 ， 因 为 参数 的 顺序 指出 ， 
要 首先 扫描 关系 TEACHING。 可 以 使 用 排序 -合并 或 块 媒 套 来 计算 这 个 表达 式 。 这 两 种 方法 的 开 
销 都 比较 大 ， 所 以 要 丢弃 它们 。 . 

一 旦 选择 了 计算 联结 的 最 好 的 计划 ， 那 么 我 们 可 以 把 联结 的 结果 看 成 一 元 表达 式 E， 我 们 
现在 要 为 rnan。( gsemeser = Frle4 (E)) 找 出 一 个 计划 。 因 为 E 的 结果 不 需要 排序 和 索引 ， 又 因为 
不 需要 消除 重复 ， 所 以 我 们 选择 顺序 扫描 存 取 路 径 来 计算 两 个 选择 和 投影 。 另 外 ， 因 为 E 在 内 
存 中 生成 结果 ， 所 以 我 们 选择 管道 传输 来 避免 把 中 间 结 果 保 存 到 磁盘 上 。 

利用 动态 编程 算法 ， 可 能 会 错过 一 些 很 好 的 计划 ， 因 为 它 关注 在 当前 时 刻 什么 是 最 好 的 ， 
而 设 有 尝试 往 前 再 看 一 看 。 可 以 改进 一 下 ,不 仅 保留 最 好 的 计划 ， 还 保留 某 些 “有 趣 的 ” 计 
划 。 如 果 一 个 计划 的 输出 关系 是 排序 的 ， 或 者 如 果 它 有 一 个 索引 ， 那 么 即使 这 个 计划 的 代价 
不 是 最 小 的 ， 这 个 计划 也 可 以 被 看 作 是 有 趣 的 。 这 个 启发 式 方法 说 明 一 个 事实 : 排序 的 关系 
可 以 在 很 大 程度 上 减 小 随后 的 操作 的 代价 ， 比 如 排序 合并 联结 、 消 除 重复 和 重组 的 代价 。 类 
似 的 ， 索引 的 关系 可 以 减 小 随后 的 联结 的 代价 。 


14.6 调整 问题 : 对 查询 设计 的 影响 | 
数据 库 管理 之 所 以 成 为 高 新 工 作 是 有 原因 的 。 它 要 求 的 一 个 重要 技能 就 是 深入 了 解 查 询 
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优化 器 的 工作 原理 ， 并 能 用 这 一 知识 去 调整 数据 库 设 计 和 查询 以 提高 性 能 。 
1. 检查 计 划 
在 13.7 节 中 ， 我 们 讨论 了 了 解 关 系 操 作 符 的 实现 是 如 何在 物理 等 级 上 影响 设计 决定 的 。 其 
中 的 讨论 注重 涉及 单个 操作 符 的 查询 ， 但 是 通常 的 数据 库 工 作 负 载 都 包含 更 为 复杂 的 查询 。 
因此 ， 为 了 决定 用 额外 的 索引 可 以 加 快 哪个 操作 的 速度 ， 需 要 了 解数 据 库 管理 系统 为 每 个 查 
询 选择 的 查询 执行 计划 。 在 候 多 情况 下 ，、 这 要 求 对 典型 的 关系 大 小 和 联结 、 选 择 属性 中 值 的 
分 布 作 人 工 的 估计 。 显 然 ， 不 可 能 用 这 种 方法 来 分 析 查 询 执行 计划 的 数目 ， 所 以 这 个 过 程 需 
要 很 多 直觉 和 经 验 。 
数据 库 管 理 系 统 厂 商 常常 提供 各 种 工具 来 帮助 进行 调整 。 使 用 这 些 工具 通常 需要 创建 模 
型 数据 库 ， 以 在 其 中 试验 不 同 的 计划 。 在 大 多 数 数据 库 管理 系统 中 ， 典 型 工具 是 EXPLAIN 
PLAN 语句 ， 它 使 得 用 户 可 以 看 到 数据 库 管 理 系统 生成 的 查询 计划 。 这 个 语句 不 是 SQL 标准 的 
一 部 分 ， 所 以 各 厂商 的 语法 是 有 差异 的 。 基 本 的 思想 是 首先 执行 下 面 形式 的 语句 : 
EXPLAIN PLAN SET queryno=123 FOR 
SELECT P.Name 
FROM PROFESSOR P，TEACHING T 


WHERE P.Id = T.ProfId AND T.Semester = 'F1994' 
AND T.Semester = 'CS' 


它 让 数据 库 管理 系统 生成 一 个 查询 执行 计划 ， 并 把 它 存 储 到 称 为 PLAN_TABLE 的 关系 的 “ 
一 组 元 组 中 去 。queryno 是 该 表 的 一 个 属性 。 一 些 数据 库 管理 系统 使 用 不 同 的 属性 名 ， 比 如 Id。 
可 以 查询 PLAN_TABLE 来 检索 这 个 计划 : 

SELECT * FROM PLAN_TABLE WHERE queryno=123 


检查 查询 计划 的 基于 文本 的 工具 是 相当 强大 的 ， 但 是 最 近 它 们 却 很 少 被 使 用 。 一 个 忙碌 
的 数据 库 管 理 员 只 把 基于 文本 的 工具 作为 最 后 的 手段 ， 因 为 很 多 厂商 为 他 们 的 调整 工具 提供 
了 华丽 的 图 形 界面 。 例 如 ，IBM 的 DB/2 有 Visual Explain ，Oracle 有 Oracle Diagnostics Pack, 
微软 的 SQL Server 有 Query Analyzer。 这 些 工具 不 仅 给 出 了 查询 计划 ， 而 且 也 给 出 了 可 以 加 速 
各 种 查询 的 索引 。 

2. 只 有 索引 的 查询 . 

确定 了 支持 各 种 查询 需要 的 可 能 的 索引 之 后 ， 数 据 库 设计 者 必须 决定 将 把 哪个 索引 放 进 
实际 的 系统 中 。 例 如 ， 同 一 关系 的 两 个 不 同 的 查询 可 能 需要 两 个 不 同 的 聚焦 索引 。 因 为 每 个 
关系 只 有 一 个 索引 可 以 是 聚 徐 的 ， 所 以 必须 要 有 解决 的 办 法 。 在 这 种 情况 下 ， 需 要 对 查询 的 
“重要 性 ”进行 排序 ， 可 以 考虑 这 个 查询 发 生 的 频繁 程度 ， 和 希望 的 响应 时 间 ， 等 等 。 

”另外 一 种 避免 聚 秘 冲突 的 方法 是 强制 优化 器 使 用 只 有 索引 的 策略 (index-only strategy). 
假设 TEAcHING 已 经 在 Semester 上 有 聚焦 B+ 树 索引 ， 但 是 另 一 个 重要 的 查询 需要 在 ProfIld 上 的 聚 
镁 索引 以 快速 访问 与 给 定 教授 相关 的 课程 代码 。 因 为 数据 库 管理 系统 不 能 在 TEAcHING 上 再 创 
建 另 外 一 个 聚 徐 索引 ， 所 以 我 们 可 以 使 用 属性 序列 ProfIfd、CrsCode 在 TEACHING 上 创建 非 和 揪 
B'* 树 索引 来 避免 这 个 问题 。 因 为 我 们 的 查询 只 需要 Profld 和 CrsCode， 所 以 优化 器 并 不 需要 去 
查看 TEACHING 关 系 一 一 所 有 的 信息 都 可 以 从 索引 中 获得 ! 因为 索引 是 B! 树 ， 所 以 CrsCode 的 值 
在 ProfId 的 相应 值 上 是 聚 签 的 ， 这 就 产生 了 和 育 答 索引 相同 的 效果 (实际 上 ， 它 更 为 有 效 ， 因 
为 索引 更 小 ， 并 且 不 需要 检索 实际 关系 的 页 面 )。 
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只 有 索引 的 查询 处 理 可 能 看 起 来 是 最 终 的 数据 库 调 整 设 备 。 然 而 ， 很 少 有 免费 的 午餐 : 
维护 额外 的 索引 意味 着 存储 的 开销 。 更 重要 的 是 ， 额 外 的 索引 可 能 严重 地 降低 更 新 事务 的 性 
能 ， 因 为 每 当 改 变 对 应 的 关系 ， 就 必须 更 新 每 个 索引 。 因 此 ， 添 加 索引 对 于 高 度 动态 的 关系 
来 说 不 是 一 个 好 的 方法 。 

3. REE i Fo Si RW . 

嵌 套 查询 是 SQL 最 强大 的 特性 之 一 ， 也 是 最 难 优化 的 一 部 分 。 考 虑 下 面 的 查询 : 


SELECT P.Name, C.CrsName 


FROM PROFESSOR P, COURSE C 
WHERE P.Department='CS' AND 
C.CrsCode IN 


SELECT T.CrsCode 
FROM TEACHING T 
WHERE T.Semester='F1995' AND T.ProfId = P.Id 


这 个 查询 返回 一 组 行 ， 这 些 行 的 第 一 个 属性 值 是 在 1995 年 秋季 教 过 一 门 课 的 计算 机 科学 系 教 
授 的 名 字 ， 第 二 个 属性 的 值 是 这 门 课程 的 名 字 。 

通常 ， 查 询 处 理 器 把 这 个 查询 分 成 两 个 部 分 ， 并 将 内 层 查询 作为 一 个 独立 的 优化 的 单位 ， 
同时 也 对 外 层 查 询 进行 独立 优化 (把 内 层 SELECT 语句 的 结果 集 视 为 数据 库 关 系 )。 因 为 进行 
了 这 样 的 分 解 ， 所 以 查询 优化 器 可 能 不 再 考虑 某 些 优化 一 一 例如 ， 不 考虑 TEACHING 上 的 聚 入 
索引 和 搜索 键 (ProfId, CrsCode), MAMKRE AR 是 为 提供 的 PITd 的 每 个 值 产生 一 一 组 课 
程 代码 。 另 一 方面 ， 可 以 看 出 ， 上 面 的 查询 等 价 于 


SELECT C.CrsName, P.Name 

FROM PROFESSOR P, TEACHING T, COURSE C 

WHERE T.Semester='F1995' AND P.Department='CS' 
AND P.Id = T.ProfId AND T.CrsCode=C.CrsCode 


FE LCE ORE 1 BE HS I 1 A FR ESL 

EEKE, SEWERE KRES OARRETE. ARRES RR 
KERMA GT. Rm. ERR Se Ae aD HR BE ERD k. 

4. 存储 过 程 

存储 过 程 的 优势 在 第 10 章 讨论 过 。 它 们 的 重要 性 质 是 它们 是 由 数据 库 管 理 系统 编译 的 ， 
TE 全 下 本 lM: BAB POW i tele fb tr EN 
优化 器 。 然 而 ， 要 认识 到 ， 在 编译 时 产生 的 查询 执行 计划 表示 优化 器 基于 那 时 可 以 得 到 的 
E TE E AE E SA M ADTA, 这 意味 着 如 果 之 后 加 入 、 删 除 索 引 或 者 相关 统计 
信息 发 生 大 的 改变 时 ， 之 前 生成 的 查询 计划 可 能 就 不 再 是 好 的 了 ， 甚 至 是 不 可 行 的 。 因 此 ， 
不 应 该 对 涉及 非常 动态 的 关系 的 查询 使 用 存储 过 程 ， 并 且 最 好 在 索引 变化 的 时 候 重 新 编译 
这 些 过 程 。 


14.7 参考 书目 


在 [Garcia-Molina et al. 2000] 中 可 以 找到 针对 查询 优化 的 详细 的 讨论 。 在 {Griffiths-Selinger et al. 
1979, Wong and Youssefi 1976] 中 描述 了 启发 式 搜 索 算法 。 
如 果 想 进一步 阅读 关于 最 新 的 查询 优化 技术 和 其 他 的 参考 ， 请 看 [Toannidis 1996, Chaudhuri 1998]。 
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148 练习 


14.1 
14.2 


14.4 


14.6 


对 于 投影 操作 可 能 有 可 交换 的 转换 吗 ? 请 解释 原因 。 

B HERAS) PCqp-gT) 转 换 成 ra((re(T) >qds-p rrAcp(S)) D< c-B R) 所 需要 的 一 系列 步骤 。 为 了 让 

上 面 的 转换 正确 进行 ， 请 列 出 模式 R、S 和 T 都 必须 要 有 的 属性 以 及 这 些 模式 (或 者 某 些 ) 不 可 以 

有 的 属性 。 

使 用 14.2 节 给 出 的 启发 式 规则 ， 在 什么 条 件 下 可 以 把 表达 式 xA((R P46owe1S) PS cong, T) $4 HR AE 

TA(TB(RPqeod Ke(S)) 2q cona, TP(T))? 

考虑 用 在 14.3 节 的 实例 中 的 联结 PRoFESsoR qin-pxorpoTEACHING。 我 们 稍微 改变 一 下 统计 数字 ， 假 设 

TEACHING.ProfId 的 不 同 值 的 数目 是 10 000 ( 它 翻 译 成 这 个 属性 较 低 的 权 值 ) 。 

a. PROFESSOR 关 系 的 基数 是 多 少 ? 

b. 假定 在 ProfId 上 有 非 诊 铸 的 散 列 索 引 ， 并 且 假 设 就 像 以 前 一 样 ，5 个 PROFESSOR 元 组 可 以 放 进 一 
个 页 ，10 个 TeAcHING 元 组 可 以 放 进 一 个 页 ，TEACHING 的 基数 是 10 000。 估 计 在 有 51 页 的 缓冲 区 
的 情况 下 使 用 索引 嵌 套 循环 和 块 幅 套 循环 计算 上 面 联结 的 代价 。 

考虑 下 面 的 查询 

SELECT DISTINCT E.Ename 

FROM EMPLOYEE E 

WHERE E.Title = 'Programmer' AND E.Dept = ‘Production' 

假设 

。10% 的 雇员 是 程序 员 。 

“5% 的 雇员 是 为 生产 部 门 工作 的 程序 员 。 

“有 10 个 部 门 。 

。EMPLOYEE 关 系 有 1000 个 页 ， 每 页 有 10 个 元 组 。 

“有 51 页 的 缓冲 区 可 以 用 来 处 理 这 个 查询 。 

为 下 面 的 每 个 情况 找 出 最 好 的 查询 执行 计划 : 

a. 在 Title 上 有 了 唯一 的 索引 ， 并 且 是 聚 秘 的 2 级 B* 树 。 

b. 在 属性 序列 Dept、Tittle、Ename 上 有 唯一 的 索引 ， 并 且 是 聚 秘 的 ， 它 有 2 级 。 

c. 在 Dept、Ename、Title 上 有 了 唯一 的 索引 ,并 且 是 聚 往 的 3 级 B* 树 。 

d. 在 Dept 上 有 非 聚 镁 的 散 列 索引 ， 在 Ename 上 有 2 级 聚 徐 树 索 引 。 

考虑 下 面 的 模式 ， 其 中 键 属性 加 了 下 划 线 : 


EMPLOYEE(SSN, Name ,Dept) 
PROJECT (SSN, PID, Name , Budget) 


PRoJECT 中 的 SSN 属 性 是 为 这 个 项 目 工作 的 雇员 的 1d。 每 个 项 目 中 有 若干 雇员 ,但 是 函数 依赖 
Pid > Name, Budget 是 成 立 的 〈 所 以 关系 不 是 规范 化 的 )。 考 虑 查询 


SELECT P.Budget, P.Name, E.Name 

FROM EMPLOYEE E, PROJECT P 

WHERE E.SSN = P.SSN AND 
P.Budget > 99 AND 
E.Name = 'John' 

ORDER BY P.Budget 


假设 有 下 面 的 统计 信息 : 
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。 在 EMPLOYEE 关 系 中 有 10 000 个 元 组 。 
。 在 PROIECT 关 系 中 有 20 000 个 元 组 。 
。 在 每 个 关系 中 每 页 有 40 个 元 组 。 
。 有 10 页 的 缓冲 区 。 
` e E Name 有 1000 个 不 同 的 值 。 
。Budget 域 包含 了 1 ~ 100 的 整数 。 
Bal: 
 EMPLOYEEX #& 
在 Name 上 : JERR, Bl. 
在 SSN 上 : RA, 342B HH. 
e PROJECT Š: 
”在 SSN 上 : IERE, BAN 
在 Budget 上 : RR, 2B. 
a. 画 出 充分 下 推 的 查询 树 。 
b. 找 出 “最 好 的 ”执行 计划 和 次 好 的 计划 。 每 个 计划 的 代价 是 多 少 ? 解释 你 是 如 何 得 到 答案 的 。 
14.7 考虑 下 面 的 模式 ， 其 中 键 属性 加 了 下 划 线 (不同 的 键 加 的 下 划 线 不 一 样 ): 


PROFESSOR(Id, Name, Department) 


CoursE(CrsCode, Department, CrsName) 
TEACHING(ProfiId, CrsCode, Semester) 





考虑 下 面 的 查询 : 
SELECT C.CrsName, P.Name 
FROM PROFESSOR P, TEACHING T, COURSE C 


WHERE T.Semester='F1995' AND P.Department='CSs' 
AND P.Id = T.ProfId AND T.CrsCode=C.CrsCode 
假设 有 下 面 的 统计 信息 : 
。 在 PROFESSOR 关 系 中 有 1000 个 元 组 ， 每 页 上 有 10 个 元 组 。 
*。 在 TEACHING 关 系 中 有 20000 个 元 组 ， 每 页 上 有 10 个 元 组 。 
* 在 CoursE 关 系 中 有 2000 个 元 组 ， 每 页 上 有 5 个 元 组 。- 
。 有 5 页 的 缓冲 区 。 
。 对 于 Department 有 50 个 不 同 的 值 。 
。 对 于 Semester 有 200 个 不 同 的 值 。 
。 索 引 : 
。PROFESSOR 关 系 : 
在 Department 上 : RR, 2 级 B' 树 。 
在 ld 上 : JERR, BOI. 
e COURSES 关 系 : 
在 CrsCode 上 : 已 排序 (没有 索引 )。 
在 CrsName 上 : #5, JERR. 
。TEACHING 关 系 : 
fEProfld: RH, 2B. 
fESemester, CrsCode k: JERR, 2B. 
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a. 首先 ， 给 出 与 上 面 的 SQL 查询 对 应 的 没有 优化 过 的 关系 代数 表达 式 ， 然 后 画 出 相应 的 完全 下 推 
的 查询 树 。 
b. 找 出 最 好 的 执行 计划 和 它 的 代价 ， 并 解释 你 是 如 何 得 到 答案 的 。 


14.8 考虑 下 面 的 关系 ， 它 表示 了 一 个 房地产 数据 库 的 一 部 分 : 


14.9 


AGENT(Id, AgentName) 
HouseE(Address, OwnerId, AgentId) 
AMENITY (Address, Feature) 


AGENT 关 系 保 存 了 房地产 代理 的 信息 ，HousE 关 系 具 有 谁 卖 房子 和 相关 的 代理 的 信息 ，AMENITY 关 
系 给 出 了 每 所 房子 的 特性 的 信息 。 每 个 关系 的 键 属性 都 加 了 下 划 线 。 
考虑 下 面 的 查询 : 

SELECT H.OwnerId, A.AgentName 

FROM House H, AGENT A, AMENITY Y 


WHERE  4H.Address=Y.Address AND A.Id = H.AgentId 
AND Y.Feature = '5BR' AND H.AgentId = '007' 








假设 这 个 查询 可 用 的 缓冲 区 空间 有 5 页 ， 而 且 有 下 面 的 统计 信息 和 索引 : 


e AMENITY: 
在 1000 个 房子 上 有 10 000 条 记录 ， 每 页 有 5 条 记录 。 
在 Address 上 有 聚 徐 的 2 级 B* 树 索引 。 
， 在 Feature 上 有 非 聚 化 的 散 列 索引 ，50 个 特性 。 
e AGENT: 
有 200 个 代理 ， 每 页 有 10 个 元 组 。 
在 Id 上 有 非 聚 往 的 散 列 索引 。 
e HOUSE: 
有 1000 个 房子 ， 每 页 上 有 4 条 记录 。 
在 Agenttd 上 有 非 聚 签 散 列 索引 。 
fe Address | A REA 2B HSI 
回答 下 面 的 问题 (并 解释 你 是 如 何 得 到 答案 的 ) 
a. 画 出 与 上 面 的 查询 对 应 的 完全 下 推 的 查询 树 。 
b. 找 出 最 好 的 查询 计划 来 计算 上 面 的 查询 ， 并 估计 它 的 代价 。 
c. 找 出 次 优 的 计划 ， 并 估计 它 的 代价 。 
图 14-3 中 的 查询 执行 计划 对 于 查询 14.3 ~ 14.6 都 没有 消除 重复 。 为 了 说 明 这 一 点 ， 我 们 增加 一 个 额 
外 的 关系 操作 符 8， 它 表示 消除 重复 的 操作 。 通 过 在 适当 的 地 方 增加 8 来 修改 图 14-3 中 的 计划 ， 从 
而 使 计算 的 代价 最 小 。 请 估计 每 个 新 的 计划 的 代价 。 


1410 选择 一 个 数据 库 管 理 系统 来 为 练习 14.5 中 的 情景 创建 一 个 数据 库 。 使 用 EXPLAIN PLAN 语句 (或 


者 由 你 的 数据 库 管理 系统 提供 的 等 价 的 语句 ) 来 比较 你 手工 找到 的 最 优 计划 和 由 数据 库 管理 系统 
实际 产生 的 计划 。 


14.11 仿照 练习 14.10， 但 是 使 用 练习 14.16 中 的 情景 。 
14.12 仿照 练习 14.10， 但 是 使 用 练习 14.17 中 的 情景 。 





第 15 章 事务 处 理 概述 


事务 处 理应 用 程序 中 的 事务 应 该 满足 第 2 章 中 讨论 的 ACID 性 质 一 一 原子 性 、 一 致 性 、 隔 
离 性 和 持久 性 。 事 务 的 设计 者 负责 保证 系统 中 事务 的 一 致 性 。 我 们 必须 保证 ， 如 果 每 个 事务 
独立 执行 (没有 其 他 的 事务 并 发 执行 )， 那 么 它 能 正确 运行 ， 即 它 会 维护 数据 库 的 完整 性 约束 
并 执行 其 规格 说 明 中 的 操作 (例如 ， 学 生 注 册 系 统 中 的 注册 事务 正确 更 新 学 生 和 课程 信息 )。 
其 余 的 性 质 (原子 性 、 隔 离 性 和 持久 性 ) 是 底层 的 事务 系统 的 责任 。 我 们 将 会 在 本 章 中 概述 
如 何 实现 这 些 特性 。 

本 书 的 第 四 部 分 将 给 出 这 些 问 题 的 更 为 详细 的 解释 。 如 果 你 想 研究 那 一 部 分 ， 你 可 以 跳 
过 这 一 章 。 特 别 要 注意 的 是 ， 本 章 是 数据 库 简 介 部 分 的 最 后 一 章 ， 而 不 是 事务 处 理 部 分 的 第 
一 章 。 


15.1 隔离 性 


事务 设计 者 负责 设计 每 个 事务 ， 所 以 如 果 每 个 事务 独立 执行 ， 并 且 最 初 的 数据 库 正确 地 
对 现实 企业 的 当前 状态 进行 了 建 模 ， 那 么 事务 就 可 以 正确 执行 ， 最 终 的 数据 库 也 就 可 以 正确 
地 对 企业 的 (新 ) 状态 进行 建 模 。 然 而 ， 如 果 事 务 处 理 系统 并 发 地 执行 一 组 这 样 的 事务 (以 
某 种 交叉 执行 的 方式 ) ， 那 么 后 果 可 能 就 是 数据 库 无 法 转换 到 和 现实 世界 企业 相对 应 的 状态 ， 
或 者 给 用 户 返 回 错误 的 结果 。 

图 2-4 的 调度 是 错误 的 并 发 调度 的 例子 。 该 调度 成 功 地 完成 了 两 个 注册 事务 ， 但 是 该 课程 
超员 了 ， 而 注册 学 生 的 总 数目 只 增加 了 一 个 。 失 败 的 原因 是 交叉 执行 。 两 个 事务 都 读 取 了 
cur_reg 相 同 的 值 ， 所 以 它们 都 没有 考虑 到 对 方 的 影响 。 我 们 把 这 种 情况 称 为 缺少 隔离 性 ( 即 
ACID 中 的 1)。 

系统 实现 隔离 性 的 一 种 方法 是 以 某 种 串 行 的 顺序 一 个 接着 一 个 地 执行 事务 一 每 个 事务 
只 有 在 前 一 个 事务 完成 之 后 才 可 以 开始 。 假 设 独立 执行 的 事务 都 可 以 正确 完成 ， 那 么 串 行 调 
度 将 是 正确 的 。 假 设 数据 库 在 调度 开始 的 时 候 可 以 对 现实 世界 进行 正确 地 建 模 ， 那 么 它 在 每 
个 事务 完成 后 也 将 会 对 现实 世界 进行 正确 地 建 模 。 

但 是 ， 对 于 很 多 应 用 程序 来 说 ， 串 行 执行 将 导致 无 法 容忍 的 很 小 的 事务 吞吐 量 ( 用 每 秒 
的 事务 数 来 衡量 ) 和 用 户 无 法 接受 的 很 长 的 响应 时 间 。 尽 管 限 制 事务 处 理 系统 只 执行 串 行 调 
度 是 不 实际 的 ， 但 是 串 行 调度 是 很 重要 的 ， 因 为 它们 可 以 作为 衡量 正确 性 的 主要 标准 。 如 果 
非 串 行 调度 具有 和 串 行 调 度 相 同 的 结果 ， 那 么 就 可 以 保证 它 也 是 正确 的 。 

注意 ， 这 里 的 推理 只 能 朝 一 个 方向 进行 。 和 串 行 调度 具有 不 同 效果 的 非 串 行 调度 不 一 定 
就 是 错误 的 。 我 们 将 会 看 到 大 多 数 数据 库 管 理 系 统 人 允许 应 用 程序 设计 者 灵活 执行 非 串 行 调 度 。 
然而 ， 我 们 首先 讨论 可 串 行 化 调度 : 和 串 行 调 度 等 价 的 调度 。 
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15.1.1 TRE 

提高 性 能 以 优 于 串 行 执行 并 且 实 现 隔 离 性 的 一 种 方法 是 保证 调度 是 可 串 行 化 的 。 可 串 行 
化 调度 (serializable schedule) 是 等 价 于 串 行 调度 的 调度 。 下 面 我 们 将 讨论 等 价 的 含义 。 

先 举 一 个 简单 的 例子 ， 假 设 事 务 Ti 只 对 数据 库 的 数据 项 x 和 ?进行 读 和 写 ， 事 务 Tz 只 对 数据 
库 的 数据 项 z 进 行 读 和 写 。 即 使 事务 是 交叉 技 行 的 ， 如 调度 

ri (x) wa (z) wi O) 
那么 T, 的 访问 对 T1 没 有 影响 ，T! 的 访问 对 Ts 也 没有 影响 。 因 此 ， 调 度 的 总 体 结果 和 按 顺 序 TT 
或 T T 串 行 执行 事务 的 结果 是 一 样 的 ， 即 下 面 的 串 行 调度 之 一 : 

ri (x) Wi O) w2 (z) 
或 

Wo (z) ri (x) wi O) 

注意 ， 这 两 个 等 价 的 串 行 调度 都 是 由 最 初 的 调度 通过 互 换 操作 的 位 置 得 来 的 。 在 第 一 个 
例子 中 ， 互 换 了 两 个 写 操作 。 它 们 可 以 互 换 是 因为 它们 在 不 同 的 数据 项 上 操作 ， 因 此 不 管 它 
们 以 何 种 顺序 执行 ， 都 将 使 数据 库 具 有 相同 的 最 终 状 态 。 在 第 二 个 例子 中 ， 我 们 互 换 了 rm (x) 
Fiw: (z)。 这 些 操 作 也 可 以 互 换 是 因为 它们 在 不 同 的 数据 项 上 操作 ， 因 此 T, 在 两 个 顺序 中 都 得 
到 了 相同 的 x 值 ， 数 据 库 具有 相同 的 最 终 状 态 。 

假设 除 此 之 外 ，T!, 和 T; 还 读 取 一 个 共同 的 数据 项 q。 总 体 结果 还 是 和 以 上 述 两 种 顺序 之 一 
串 行 执行 事务 的 结果 是 相同 的 。 因 此 调度 

Ty (X) r (q) w2 (z) ri (q) wi O) 
和 串 行 调度 〈T, 的 所 有 操作 都 在 T: 的 操作 之 前 完成 ) 
ri (x) ri (9) wi O) r (g) wz (2) 
具有 相同 的 结果 。 这 两 种 调度 之 间 的 等 价 又 是 基于 互 换 性 。 这 个 例子 说 明 的 一 个 新 特性 是 互 
换 不 一 定 要 求 操 作 必 须 访问 不 同 的 数据 项 。 在 这 种 情况 下 ，r (9) 和 m (4) 可 以 互 换 是 因为 它们 
在 两 种 执行 顺序 下 都 给 事务 返回 相同 的 值 。 

图 2-4 所 示 的 两 个 注册 事务 的 调度 是 不 可 串 行 化 的 。 我 们 不 能 通过 一 系列 相 邻 操作 的 互 换 
来 得 到 等 价 的 串 行 调 度 ， 因 为 在 同一 个 数据 项 上 的 读 操 作 和 写 操作 是 不 可 互 换 的 ， 而 且 在 同 
一 个 数据 项 上 的 两 个 写 操作 也 不 可 以 互 换 。 

通常 ， 我 们 感 兴趣 的 是 说 明 什 么 时 候 某 组 并 发 执行 的 事务 的 调度 S 等 价 于 ( 即 具有 相同 的 
PUTER) 那 组 事务 的 某 个 串 行 调度 S。 通 俗 地 说 ， 我 们 所 要 求 的 就 是 在 两 个 调度 中 

。 由 相应 的 读 操作 返回 的 值 是 相同 的 。 

。 以 相同 的 顺序 对 每 个 数据 项 进行 更 新 。 

如 果 S 和 Sse: 中 每 个 读 操作 返回 相同 的 值 ， 那 么 由 事务 完成 的 计算 在 两 个 调度 中 将 是 相同 
的 ， 因 此 事务 将 把 相同 的 值 写 回 数据 库 中 。 因 为 在 两 个 调度 中 以 相同 的 顺序 进行 写 操作 ,- 它 
们 将 使 数据 库 具 有 相同 的 最 终 状 态 。 因 而 ，S 和 S,。. 具 有 相同 的 结果 (因此 是 等 价 的 )。 

如 果 一 组 事务 的 调度 如 上 所 述 的 那样 等 价 于 一 个 串 行 调度 ， 那 么 称 这 个 调度 是 可 串 行 化 
(serializable) 调度 。 因 为 在 串 行 调度 中 一 次 只 执行 一 个 事务 ， 事 务 之 间 不 可 能 相互 影响 。 因 





而 ， 称 它们 是 隔离 的 。 另 外 ， 因 为 串 行 调度 和 可 串 行 化 调度 之 间 是 等 价 的 ， 所 以 把 可 串 行 化 
调度 中 的 事务 也 称 为 是 隔离 的 。 

数据 库 系 统 可 以 保证 调度 是 可 串 行 化 的 。 通 过 允许 可 串 行 化 调度 ， 它 们 允许 程度 更 高 的 
并 发 性 ， 因 此 性 能 得 到 提高 。 这 些 系统 也 提供 了 不 要 求 调度 为 可 串 行 化 的 这 样 较为 宽松 的 隔 
离 观点 ( 稍 后 讨论 ) ， 因 此 它们 支持 程度 更 高 的 并 发 性 并 得 到 更 好 的 性 能 。 因 为 这 样 的 调度 不 
一 定 等 价 于 品行 调度 ， 所 以 并 不 能 对 所 有 程序 都 保证 正确 性 。 因 此 ， 必 须 愤 重 使 用 较为 宽松 
的 隔离 观点 。 

负责 保证 隔离 性 的 事务 处 理 系统 部 分 称 为 并 发 控制 (concurrency control) 。 并 发 控制 通过 
控制 数据 库 操作 的 调度 来 保证 隔离 性 。 当 事务 想 读 写 数据 库 数 据 项 时 ， 它 把 这 个 请 求 发 送 给 
并 发 控制 。 并 发 控制 知道 到 那 一 时 刻 为 止 已 经 批准 的 请 求 序列 ， 但 是 它 不 知道 将 会 有 什么 请 
求 到 达 ， 并 发 控制 会 决定 如 果 在 那个 时 刻 批 准 那个 请 求 是 否 能 保证 隔离 性 。 如 果 不 能 保证 隔 
离 性 ， 请 求 就 不 能 批准 ， 因 此 事务 要 么 被 迫 等 待 ， 要么 异常 中 止 。 


15.1.2 两 段 锁 


商用 系统 中 大 多 数 并 发 控制 用 严格 的 两 段 锁 协议 (strict two-phase locking protocol) 
[Eswaran et al. 1976] 来 实现 可 串 行 性 。 这 个 协议 使 用 与 数据 库 中 数据 项 相关 的 锁 ， 要 求 事务 
在 访问 数据 项 之 前 要 拥有 适当 的 锁 。 当 事务 想 读 (或 写 ) 数据 库 的 数据 项 时 ， 它 向 并 发 控制 
发 送 一 个 请 求 ， 并 发 控制 在 把 这 个 请 求 传 递 给 执行 这 个 访问 的 数据 库 系统 模块 之 前 必须 授予 
该 事务 在 那个 数据 项 上 的 读 锁 (read lock) 或 写 锁 (write lock )。 系 统 依据 下 面 的 规则 来 完成 
锁 的 请 求 、 授 予 和 释放 : 

1) 如 果 事 务 T 请 求 读 一 个 数据 项 ， 并 且 没 有 其 他 的 事务 拥有 这 个 数据 项 上 的 写 锁 ， 那 么 控 
制 就 把 那个 数据 项 上 的 读 锁 授予 T， 人 允许 操作 继续 进行 。 注 意 ， 因 为 其 他 事务 可 能 在 那 时 拥有 
该 数据 项 上 的 读 锁 ， 所 以 读 锁 常常 也 称 为 共享 (shared) 锁 。 

2) 如 果 事 务 T 请 求 读 一 个 数据 项 ,: 但 是 另 一 个 事务 T 拥 有 那个 数据 项 上 的 写 锁 ， 那 么 T 必 
须 等 到 T' 完 成 (并 释放 它 的 锁 ) 为 止 。 我 们 称 这 个 读 请 求 与 之 前 批准 的 写 请 求 冲 突 
(conflict ) 。 . 

3) 如 果 事 务 T 请 求 写 一 个 数据 项 ， 并 且 没 有 其 他 的 事务 在 那个 数据 项 上 拥有 读 锁 或 写 锁 ， 
那么 控制 就 把 那个 数据 项 上 的 写 锁 授予 T, 允许 操作 继续 进行 。 因 为 写 锁 排斥 了 所 有 其 他 的 锁 ， 
所 以 也 常常 称 之 为 排他 (exclusive) H. l 

4) MRESTARS—TREM, HRA-THSTHARTREM ERRE, AP 
么 IT 必须 等 到 T 完 成 〈 并 释放 它 的 锁 ) 为 止 。 我 们 称 这 个 写 请 求 与 之 前 批准 的 读 请 求 或 写 请 求 
冲突 。 
5) 一 旦 授予 事务 锁 ， 事 务 就 拥有 了 这 个 锁 。 数 据 项 上 的 读 锁 允许 事务 对 那个 数据 项 进行 
读 。 数 据 项 上 的 写 锁 人 允许 事务 对 那个 数据 项 进行 读 或 写 。 当 事务 完成 时 ， 它 释放 授予 它 的 所 
有 锁 。 

上 述 规则 规定 ， 如 果 请 求 不 和 之 前 批准 的 来 自 另 一 个 活动 事务 的 请 求 冲 突 ， 就 可 以 批准 
， 这 个 请 求 。( 来 自 不 同事 务 的 ) 请 求 如 果 属 于 下 面 的 情况 之 一 就 不 会 冲突 : 

。 它 们 引用 不 同 的 数据 项 。 
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。 它们 都 是 读 请 求 。 

图 15-1 以 表格 的 形式 说 明了 数据 项 之 间 的 冲突 关系 。 x 表示 冲突 。 

并 发 控制 使 用 锁 来 记 住 当前 的 活动 事务 之 前 执行 的 已 批准 的 模式 
数据 库 操作 。 事 务 要 在 数据 项 上 执行 操作 ， 只 有 当 这 个 yo 
操作 和 当前 的 活动 事务 之 前 在 那个 数据 项 上 执行 的 所 有 读 
其 他 操作 可 以 互 换 (不 冲突 ) 的 条 件 下 ， 系 统 才 能 授予 写 x 
该 事务 锁 来 执行 相应 操作 。 例 如 ， 因 为 数据 项 上 的 两 个 
读 操作 是 可 以 互 换 的 ， 所 以 即使 一 个 事务 当前 拥有 那个 
数据 项 上 的 读 锁 ， 也 可 以 授予 另 一 个 事务 在 那个 数据 项 
上 的 读 锁 。 用 这 种 方法 ， 控 制 保证 活动 事务 的 操作 可 以 互 换 ， 所 以 在 任何 时 候 这 些 操作 都 可 
以 以 任何 顺序 串 行 化 。 这 个 结果 是 证 明 任何 由 并 发 控制 产生 的 调度 都 和 串 行 调度 等 价 的 基础 。 

如 果 每 个 事务 都 是 先 经 历 获得 锁 的 阶段 ， 然 后 经 历 释放 锁 的 阶段 ， 那 么 锁 控 制 就 称 为 是 
两 段 的 (two-phase)。 之 所 以 称 它 为 严格 的 (strict) 两 段 锁 控制 ， 是 因为 每 个 事务 都 保持 它 
的 锁 直 到 事务 完成 为 止 : 第 二 阶段 就 被 压缩 成 时 间 上 的 一 个 点 。 在 非 严格 (nonstrict) 的 两 段 
锁 控 制 中 ， 第 二 阶段 在 事务 得 到 它 需要 的 所 有 锁 之 后 就 开始 了 。 在 第 二 阶段 中 ， 事 务 可 以 在 
任何 时 候 释 放 锁 。 

尽管 非 严 格 的 两 段 协议 保证 了 可 串 行 性 ， 但 是 当 事 务 异 常 中 止 的 时 候 就 出 问题 了。 如 果 
事务 Ti 修改 了 数据 项 x， 然 后 在 它 的 第 二 阶段 释放 在 其 上 的 锁 ， 第 二 个 事务 T 读 了 这 个 新 的 值 
随后 提交 了 。 因 为 Ti 在 完成 之 前 就 释放 了 x 上 的 锁 ， 所 以 它 随后 可 能 会 异常 中 止 。 原 子 性 要 求 
异常 中 止 的 事务 不 能 对 数据 库 状 态 有 任何 影响 ， 所 以 如 果 T1 异 常 中 止 ，x 要 恢复 到 最 初 的 值 。 
这 些 事 件 可 以 记录 为 下 面 的 调度 : 

w, (x) rz (x) w2 (y) commit, abort, (15.1) 

Ts 已 经 对 y 写 入 了 新 值 ， 而 这 可 能 就 是 基于 它 读 到 的 x 值 。 因 为 T, 读 到 的 x 值 是 由 随后 异常 
中 止 的 事务 产生 的 ， 所 以 违反 了 原子 性 。 因 此 ， 即 使 在 非 严 格 的 控制 中 事务 也 要 保持 写 锁 ， 
直到 它 提 交 为 止 。 在 23.2 节 中 可 以 找到 关于 这 个 问题 的 更 为 完整 的 描述 ， 在 23.3 和 23.4 节 中 可 
以 找到 并 发 控制 更 为 完整 的 介绍 。 

使 用 严格 两 段 锁 的 并 发 控制 会 产生 在 提交 顺序 上 可 串 行 化 的 调度 。 也 就 是 说 ， 调 度 S 等 价 
于 串 行 调度 Se， 在 Ss 中 事务 的 顺序 和 它们 在 S 中 提交 的 顺序 是 相同 的 。 为 了 理解 为 什么 会 这 
样 ， 注 意 写 锁 直到 提交 的 时 候 才 释放 ， 所 以 不 允许 事务 读 (或 写 ) 尚未 提交 的 事务 写 过 的 数 
据 项 。 因 此 ， 每 个 事务 “看 到 ”的 是 在 其 完成 之 前 提交 的 事务 序列 所 产生 的 数据 库 。 非 严格 
的 两 段 锁 协 议 产生 可 串 行 化 的 调度 ， 但 是 不 必 在 提交 顺序 上 可 串 行 化 。 

对 于 很 多 应 用 程序 来 说 ， 用 户 希望 事务 在 提交 顺序 上 是 可 串 行 化 的 。 例 如 ， 你 希望 在 你 
的 银行 存款 事务 提交 之 后 ， 任 何 之 后 提交 的 事务 将 看 到 那 笔 存款 的 结果 。 

在 23.1 节 中 可 以 找到 关于 可 串 行 性 更 为 完整 的 讨论 。 

两 段 锁 协 议 的 原理 是 拥有 锁 直 到 可 以 安全 地 释放 它们 为 止 。 较 早 地 释放 锁 可 能 导致 不 一 
致 的 数据 库 状 态 或 使 事务 给 用 户 返 回 错误 的 结果 。 数 据 库 领域 已 经 使 用 专用 的 术语 来 描述 可 
能 会 遇 到 的 一 些 异常 。 


图 15-1 两 段 锁 并 发 控制 的 冲突 表 。 
锁 模 式 之 间 的 冲突 用 X 表 示 
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， 脏 读 ”假设 事务 Ts 读数 据 项 x+， 事 务 T, 在 完成 之 前 对 x 进行 过 写 操作 。 如 果 T 在 它 提交 之 
前 释放 它 获得 的 x 上 的 写 锁 ， 那 么 就 可 能 发 生 这 种 情况 。 因 为 由 读 操 作 返 回 的 x 的 值 不 是 
被 已 提交 的 事务 所 写 (我们 把 这 样 的 值 称 为 提交 的 )， 它 不 可 能 反映 在 数据 库 中 。 这 就 
是 我 们 所 说 的 脏 读 (dirty read)。 例 如 ，Ti 可 能 在 Ts 读 了 x 之 后 异常 中 止 ， 产 生 调度 


Ww, (x) r, (x) abort, 


当 T! 异 常 中 止 ， 它 对 x 的 修改 就 要 回 退 。 因 此 ，T, 读 了 本 不 应 该 在 数据 库 中 出 现 的 值 。 
(15.1) 中 的 问题 是 由 脏 读 引起 的 。 

* 不 可 重复 读 假设 事务 T1 读 了 数据 项 x+， 然 后 它 在 完成 之 前 释放 它 获得 的 读 锁 。 另 一 个 事 
务 Ts 可 能 写 了 x 并 提交 。 如 果 T 重 新 获得 x 上 的 读 锁 并 读 了 它 的 值 ， 那 么 第 二 次 读 返 回 的 
值 和 第 一 次 读 返 回 的 值 就 不 相同 。 我 们 把 这 种 情况 称 为 不 可 重复 读 (nonrepeatable read). 
这 种 情况 可 以 由 下 面 的 调度 来 说 明 。 

ri (x) w: (x) commit, r; (x) 


注意 ， 在 这 个 例子 中 ，T2 在 第 二 次 读 之 前 已 经 提交 ， 所 以 第 二 次 读 不 是 脏 读 。 尽 管 不 可 
重复 读 可 能 看 起 来 并 不 是 重要 的 问题 (为 什么 事务 要 两 次 读 相同 的 数据 项 ? ) ， 但 是 它 
是 较为 严重 的 一 个 问题 的 征兆 。 例如 , 假设 x 是 航班 上 的 一 组 乘客 , y 是 这 组 乘客 的 人 数 。 
在 下 面 的 调度 中 ，T, 在 这 个 航班 上 预订 了 一 个 座位 ， 因 此 向 x 添加 了 一 个 条 目 ， 并 使 y 加 
1。T: 读 了 x 和 >， 并 且 在 添加 新 乘客 之 前 就 看 到 乘客 列表 ， 在 增加 乘客 人 数 之 后 看 到 乘 
客人 数 一 一 这 就 产生 了 不 一 致 。 
Ty (x) r2 Œ) W2 (x) r (y) w2 (Y) commit, r, (y) . 

这 个 调度 直接 与 前 一 个 相关 。 在 两 种 情况 下 ， 锁 不 是 两 阶段 的 ，T, 禾 盖 了 活动 事务 读 过 
的 数据 项 。 

"FARH ”假设 事务 读 了 数据 项 x 的 值 ， 根 据 读 到 的 值 ， 把 新 值 写 回 x。 银 行 系统 的 存款 
事务 就 是 这 种 活动 的 实例 ， 其 中 x 是 要 存款 账户 的 余额 。 如 果 这 样 的 事务 在 获得 写 锁 之 
前 释放 它 已 经 获得 的 读 锁 ， 那 么 在 同一 个 账户 上 的 两 个 存款 事务 就 可 能 交叉 执行 ， 如 下 
面 的 调度 所 示 : 

rı (x) r2 (x) w2 (x) commit, w, (x) commit, 
我 们 又 要 考虑 Ts 在 T, 的 最 后 一 个 操作 之 前 提交 的 情况 。 这 种 情况 称 为 丢失 更 新 (1lost 
update): T, 的 结果 丢失 了 ， 因 为 T 写 入 的 值 是 基于 x 最 初 的 值 而 不 是 T, 写 和 的 值 。 因 此 ， 
如 果 T1 试 图 存 信 $5，Ts 试 图 存 人 $10， 而 最 后 数据 库 只 增加 了 $5。 
这 些 异 常 和 其 他 未 命名 的 异常 一 样 ， 都 会 使 事务 返回 错误 的 结果 ， 数 据 库 可 能 会 变 得 不 一 致 。 


15.1.3 死 锁 


假设 事务 Ti 和 Ta 都 想 对 数据 项 x 和 ?进行 写 操作 ， 但 是 以 相反 的 顺序 进行 写 操作 。 在 一 种 可 
能 的 调度 中 ，T, 封 锁 了 x 并 进行 写 操作 ; T: 封 锁 了 ?并 进行 写 操作 ; Ti 请 求 写 y， 但 是 因为 T 封 
锁 了 ?， 所 以 必须 等 待 ; T 请 求 写 x， 但 因为 Ti 封锁 了 zx， 所 以 也 必须 等 待 。 

W (x) w2 (y) Request_w, (y) Request_w, (x) 
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此 时 ，Ti 等 待 T: 完 成 ，T: 等 待 Ti 完成 。 两 者 将 会 永远 等 待 下 去 ， 因 为 谁 也 不 可 能 完成 。 

这 种 情况 称 为 死 锁 (deadlock )。 通 常 ， 只 要 存在 等 待 循环 ， 即 一 系列 事务 T ，T ，…，T,， 
其 中 每 个 事务 T 都 在 等 待 访问 被 T;, 封 锁 的 数据 项 ，T, 在 等 待 访问 被 T! 封 锁 的 数据 项 ， 这 时 就 
会 出 现 死 锁 。 虽 然 两 段 锁 特别 容易 出 现 死 锁 ， 但 是 死 锁 可 能 出 现在 任何 并 发 控制 中 ， 只 要 它 
允许 事务 在 请 求 一 个 数据 项 上 的 锁 的 时 候 ， 还 保持 另 一 个 数据 项 上 的 锁 。 这 样 的 控制 必须 有 
检测 死 锁 ， 然 后 异常 中 止 等 待 循环 中 一 个 事务 的 机 制 ， 以 使 得 循环 里 剩余 的 事务 中 至 少 有 一 
个 可 以 继续 进行 下 去 。 

利用 这 样 的 机 制 ， 不 管 什么 时 候 只 要 事务 被 迫 等 待 ， 控 制 就 会 检测 是 否 将 会 形成 等 待 事 
务 的 循环 。 因此， 如 果 T 必 须 等 待 T,， 控 制 就 会 检测 Ts 是 否 也 在 等 待 ， 如 果 是 的 话 ， 它 为 什 
么 而 等 待 。 这 个 过 程 继续 下 去 ， 就 会 发 现 一 连 串 等 待 的 事务 ， 如 果 这 个 串 循环 回 到 事务 Ti， 
那么 就 检测 到 一 个 死 锁 。 另 一 个 机 制 是 使 用 超时 (timeout)。 只 要 事务 已 经 等 待 了 “很 长 ”时 
间 ， 控 制 就 假设 存在 死 锁 ， 并 异常 中 止 这 个 事务 。 可 以 在 23.4.2 节 中 找到 关于 死 锁 的 较为 完整 
的 讨论 。 

即使 有 了 检测 和 异常 中 止 这 些 手 段 ， 我 们 仍然 不 希望 有 死 锁 ， 因 为 它们 浪费 了 资源 (被 
异常 中 止 事务 执行 过 的 运算 必须 重 做 )， 并 减 慢 了 系统 执行 速度 。 应 用 程序 设计 者 应 该 设计 表 
和 事务 以 减少 死 锁 的 可 能 的 数目 。 


15.1.4 关系 数据 库 中 的 锁 


到 现在 为 止 ， 我 们 关于 加 锁 的 讨论 都 是 假设 事务 请 求 访问 某 个 命名 的 数据 项 (比如 x)。 
加 锁 在 关系 数据 库 中 有 着 不 同 的 形式 ， 在 关系 数据 库 中 事务 访问 的 是 元 组 。 尽 管 可 以 对 元 组 
加 锁 ， 但 是 事务 不 是 用 名 称 来 描述 它 想 访 问 的 元 组 ， 而 是 用 元 组 满足 的 条 件 来 描述 。 例 如 ， 
事务 用 SELECT 语句 读 到 的 元 组 的 集合 是 由 WHERE 子 句 中 的 选择 条 件 来 指定 的 e 。 

例如 ， 在 银行 系统 中 ，AccouNTs 表 可 能 对 于 每 个 独立 的 账户 都 用 一 个 元 组 表示 ， 事 务 TT 
可 能 读 取 描述 储户 Mary 控 制 的 账户 的 所 有 元 组 ， 如 下 所 示 : 

SELECT * 

FROM AccouNTs A 

WHERE A.Name = 'Mary'; 

在 这 种 情况 下 ,Ti 读 取 AccouNTs 中 满足 条 件 (Name 属 性 的 值 是 Mary) 的 所 有 元 组 。 条 
件 A.Name = 'Mary' 称 为 谓词 (predicate). 

至 于 非 关系 数据 库 ， 我 们 可 以 用 加 锁 协 议 来 保证 可 串 行 性 。 在 设计 这 样 的 协议 时 ， 我 们 
必须 决定 要 封锁 什么 样 的 数据 项 。 一 种 办 法 是 封锁 整 张 表 ， 即 使 只 访问 其 中 的 一 些 元 组 。 和 
元 组 不 同 ， 表 在 要 访问 它们 的 语句 中 指出 名 称 。 因 此 ，SELECT 语 句 可 以 被 视 为 在 这 些 数据 项 
( 即 表 ， 在 FROM 子 句 中 指出 名 称 ) 上 的 读 。 类 似 的 ，DELETE、INSERT 和 UPDATE 可 以 被 视 
为 在 已 命名 表 上 的 写 。 因 此 可 以 使 用 前 面 几 节 中 描述 的 并 发 控制 协议 ， 并 将 产生 可 串 行 化 调 
度 。 问 题 是 表 锁 是 粗 粒 度 的 : 表 可 能 包含 成 千 上 万 个 元 组 ， 因 为 要 访问 其 中 很 少 的 一 些 元 组 


日 ”在 事务 用 主键 来 存 取 元 组 的 特殊 情况 下 ， 我 们 可 以 说 该 键 值 就 是 元 组 的 名 称 ， 并 且 可 以 考虑 基于 那个 名 
称 来 封锁 元 组 。 然而， 即使 在 这 一 特殊 情况 下 ， 其 他 的 考虑 也 适用 于 关系 数据 库 (来 避免 后 面 讨论 的 幻 
影 异常 )。 





而 封锁 整 张 表 可 能 会 导致 并 发 度 的 严重 损失 。 

第 二 种 办 法 是 只 封锁 由 SELECT 语句 返回 的 元 组 。 例 如 ， 在 处 理 上 面 的 SELECT 语句 时 ， 
只 封锁 描述 Mary 账 户 的 元 组 。 这 种 办 法 的 问题 是 它 可 能 导致 称 为 幻影 (phantom) 的 异常 。 
在 处 理 完 这 个 语句 之 后 ， 但 在 Ti 提交 之 前 ， 另 一 个 事务 可 能 为 Mary 创 建 一 个 新 的 账户 ， 插 入 
描述 AccouNTs 中 那个 账户 的 新 的 元 组 :， 然 后 提交 。 那 个 元 组 称 为 幻影 。 要 注意 的 重要 一 点 是 
T! 拥 有 的 锁 并 不 能 阻止 这 个 插入 。 如 果 T 重 新 执行 SELECT， 它 除了 返回 之 前 返回 的 元 组 外 ， 
还 将 返回 :， 因 此 读 是 不 可 重复 的 (尽管 在 这 种 情况 下 Ti 没有 释放 锁 )。 至 于 不 可 重复 读 ， 问 题 
不 只 只 是 事务 执行 了 两 次 相同 的 读 操作 。 因 为 可 能 出 现 幻影 ， 所 以 封锁 元 组 并 不 能 保证 可 串 
行 化 调度 。 通 常 ， 在 事务 T 读 了 表 R 中 满足 谓词 P 的 元 组 之 后 ， 另 一 个 事务 又 在 T 结 束 之 前 向 R 
中 插入 满足 P 的 元 组 ， 这 时 就 会 发 生 幻 影 。 

注意 ， 虽 然 我们 刚 描述 的 简单 的 元 组 封锁 算法 确实 可 能 导致 幻影 但 是 当 很 多 商用 数据 
库 管 理 系 统 使 用 术语 “元 组 封锁 ”( 或 者 是 我 们 稍 后 将 会 看 到 的 “页 封锁 ”) 来 描述 并 发 控制 
算法 时 ， 意 味 着 它们 使 用 元 组 锁 (或 者 页 锁 ) 作为 更 为 复杂 封锁 算法 的 一 部 分 ， 就 像 在 24.3.1 
节 中 描述 的 那样 ， 它 确实 保证 了 可 串 行 性 。 记 住 下 面 的 警告 “ 当 所 有 方法 都 失败 时 ， 就 去 读 
FE.” 


15.1.5 隔离 级 别 


加 锁 会 阻止 并 发 ， 因 此 会 影响 到 性 能 。 所 以 尽量 减少 它们 的 使 用 。 在 两 段 协议 中 用 到 的 
表 封 锁 虽 然 产 生 了 可 串 行 化 调度 ， 但 是 由 于 封锁 的 数据 项 的 大 小 ， 它 对 并 发 有 着 极 大 的 影响 。 
元 组 封锁 更 为 有 效 ， 但 是 即使 用 在 两 段 协议 中 也 可 能 (因为 幻影 ) 导致 不 可 串 行 化 调度 。 因 
为 锁 一 直 保 持 到 提交 的 时 候 ， 所 以 严格 协议 比 非 严格 协议 更 限制 并 发 度 。 因 为 这 些 原因 ， 大 
多 数 商用 数据 库 管 理 系 统 允 许 应 用 程序 设计 者 选择 封锁 协议 ， 例 如 要 封锁 哪些 数据 项 ， 这 些 
锁 将 要 保持 多 久 。 我 们 通常 用 ANSI 标 准 隔离 级 别 来 描述 这 些 选 项 。 

数据 库 系统 经 常 支持 若干 隔离 级 别 [Gray et al. 1976]， 并 且 允 许 应 用 程序 设计 者 选择 适合 
于 特定 应 用 程序 的 级 别 。 设 计 者 应 该 选择 一 个 可 以 保证 应 用 程序 正确 执行 并 且 能 使 并 发 度 最 
大 的 级 别 。 这 些 选择 可 能 允许 不 可 串 行 化 的 调度 。ANSI 标 准 隔离 级 别 是 根据 每 一 级 别 要 避免 
的 某 种 现象 〈 或 异常 ) 来 指定 的 。 在 一 个 级 别 中 要 避免 的 现象 在 每 个 更 高 的 级 别 中 也 要 避免 。 
这 些 级 别 按 强度 递增 的 顺序 依次 是 : 

e READ UNCOMMITTED 可 以 有 脏 读 。 

e READ COMMITTED 不 允许 脏 读 (但 是 可 以 有 不 可 重复 读 )。 

e REPEATABLE READ 特定 事务 执行 的 对 同一 个 元 组 连续 的 读 不 会 产生 不 同 的 值 (但 是 

可 以 有 幻影 )。 

。SERIALIZABLE 不 允许 幻影 。 事 务 执行 必须 是 可 串 行 化 的 。 

SQL 标准 规定 同一 个 应 用 程序 的 不 同事 务 可 以 在 不 同 的 隔离 级 别 上 执行 ， 每 个 这 样 的 事 
务 可 能 看 到 也 可 能 看 不 到 与 这 个 级 别 对 应 的 现象 。 例 如 ， 在 REPEATABLE READ 级 别 上 执行 
的 事务 读 取 特 定 的 元 组 若干 次 都 将 会 看 到 相同 的 值 ， 即 使 其 他 的 事务 在 其 他 的 级 别 上 执行 。 
类 似 的 ， 在 SERIALIZABLE 级 别 上 执行 的 事务 看 到 所 有 其 他 事务 对 数据 库 做 的 改变 都 是 品行 
的 ， 而 不 管 这 些 事务 的 级 别 如 何 。 
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尽管 某 一 级 别 可 以 通过 很 多 方法 来 实现 ， 但 是 封锁 是 常用 的 技术 。 数 据 库 系统 独立 于 隔 
离 级 别 ， 它 通常 可 以 保证 每 个 SQL 语句 执行 的 原子 性 并 且 它 的 执行 是 和 其 他 语句 的 执行 相隔 
离 的 。 封锁 更 是 可 以 控制 不 同事 务 的 语句 交叉 执行 的 方法 。 

每 个 级 别 通 过 不 同 的 方法 来 使 用 锁 。 对 于 大 多 数 的 级 别 ， 事 务 在 执行 SQL 语句 的 时 候 获 
得 它们 要 存 取 的 数据 项 上 的 锁 。 根 据 如 何 存 取 这 个 数据 项 ， 锁 可 以 是 读 锁 或 者 写 锁 。 一 旦 获 
得 了 锁 ， 就 会 将 锁 保 持 到 提交 的 时 候 (在 这 种 情况 下 称 为 长 期 锁 (long duration)), Re AR 
持 到 该 语句 执行 完毕 (在 这 种 情况 下 称 为 短期 锁 (short duration ) )。 在 所 有 隔离 级 别 上 的 写 
锁 都 是 长 期 锁 。 读 锁 在 每 个 级 别 上 的 处 理 方式 不 同 。 

e READ UNCOMMITTED 没有 获得 读 锁 也 可 以 执行 读 操作 。 因 此 ， 在 这 个 级 别 上 执行 

的 事务 可 以 读 取 其 他 事务 已 经 在 其 上 加 过 写 锁 的 元 组 。 因 此 这 个 事务 可 能 会 读 取 没 有 提 

XAI GER) 数据 。 

e READ COMMITTED 在 允许 读 操 作 之 前 ， 要 获得 每 个 元 组 上 的 短期 锁 。 因 此 ， 将 会 检 

测 到 和 写 锁 的 冲突 ， 事 务 将 会 被 迫 等 待 直 到 释放 写 锁 为 止 。 因 为 写 锁 是 长 期 锁 ， 所 以 只 

能 读 取 提交 过 的 数据 。 然 而 ， 当 读 操作 完成 之 后 就 释放 读 锁 ， 所 以 特定 的 事务 对 同一 个 

元 组 两 次 连续 的 读 操作 可 能 会 被 另 一 个 事务 (更 新 这 个 元 组 然后 提交 ) 的 执行 所 分 隔 。 

这 意味 着 读 可 能 是 不 可 重复 的 。 

e REPEATABLE READ 在 由 SELECT 返回 的 每 个 元 组 上 获得 长 期 读 锁 。 因 此 尽管 可 能 存 

在 幻影 ， 但 是 不 可 能 存在 不 可 重复 读 。 

*SERIALIZABLE 如 果 在 进行 所 有 表 的 读 操作 之 前 都 要 求 获得 长 期 读 锁 ， 那 么 就 可 以 保 

证 它 是 可 串 行 化 调度 。 尽 管 这 种 方法 降低 了 并 发 度 ， 但 是 它 消除 了 幻影 。 在 15.1.7 节 描 

述 了 涉及 到 使 用 索引 的 更 好 的 实现 。 

当 事 务 使 用 游标 来 指向 元 组 时 会 发 生 一 种 特别 麻烦 的 不 可 重复 读 现象 。 尽 管 游标 正 指向 
某 元 组 ， 但 在 READ COMMITTED 级 别 上 并 发 执行 的 事务 也 可 以 修改 那个 元 组 .一 些 商用 数 
据 库 系统 支持 称 为 CURSOR STABILITY 的 隔离 级 别 ， 实 质 上 它 就 是 READ COMMITTED 再 加 
上 只 要 有 游标 指向 元 组 就 在 元 组 上 维持 读 锁 这 一 特性 。 因 此 ， 如 果 不 移动 游标 的 话 ， 读 那个 
特定 元 组 是 可 重复 的 。 l 

24.1 节 和 24.2 节 给 出 了 关于 关系 数据 库 系 统 中 隔离 级 别 的 更 为 完整 的 讨论 ， 包 含 在 每 个 隔 
离 级 别 上 正确 的 和 错误 的 调度 的 例子 。 

SNAPSHOT 隔 离 级 别 . 

有 一 个 隔离 级 别 虽然 并 不 是 ANSI 标 准 的 一 部 分 ， 但 是 常用 的 数据 库 管 理 系 统 Oracle 却 提 
供 了 这 一 隔离 级 别 ， 它 就 是 SNAPSHOT 隔 离 级 别 。SNAPSHOT 隔 离 级 别 使 用 多 版 本 
(multiversion) 数据 库 ， 即 当 (提交 了 的 ) 事务 更 新 一 个 数据 项 时 ， 并 不 丢弃 这 个 数据 项 的 旧 
值 ， 而 是 保留 这 个 旧 值 (或 版 本 )， 并 创建 新 的 版 本 。 因 此 在 任意 时 刻 ， 数 据 库 中 存在 同一 数 
据 项 的 多 个 版 本 。 对 于 任意 的 i， 系 统 可 能 构造 每 个 数据 项 的 值 ， 它 包含 了 要 提交 的 第 个 事务 
和 之 前 提交 的 所 有 事务 的 结果 。 假 设 事务 是 以 它们 提交 的 顺序 连续 索引 ， 图 15-2 说 明了 这 种 
情况 。 这 里 ， 数 据 项 的 每 个 版 本 都 用 产生 它 的 事务 的 索引 来 标记 ， 并 用 虚线 来 从 整体 上 指出 
数据 库 的 版 本 。 因 此 事务 Ts 完成 时 的 数据 库 版 本 包含 了 对 x 的 三 次 更 新 ， 对 y 的 两 次 更 新 和 对 z 
的 一 次 更 新 。 每 个 数据 库 版 本 都 称 为 快照 (snapshot). 
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图 15-2 多 版 本 数据 库 


利用 SNAPSHOT 隔 离 级 别 ， 就 不 必用 读 锁 了 。 事 务 T 请 求 的 所 有 读 操作 都 通过 当 T 第 一 次 
请 求 读 操作 之 时 提交 的 事务 序列 产生 的 快照 来 满足 。 因 为 快照 一 旦 产生 就 无 法 修改 ， 所 以 就 
没有 必要 使 用 读 锁 ， 读 请 求 也 就 不 需要 延迟 了 。 

每 个 事务 的 更 新 是 由 称 为 先 提交 者 赢 (first-committer-wins) 的 协议 来 控制 的 。 人 允许 事务 
T 提 交 需 要 满足 下 面 两 个 条 件 : (1) 没有 其 他 的 事务 在 T 第 一 次 请 求 读 和 它 请 求 提交 之 间 提 
X: (2) 没有 其 他 的 事务 更 新 T 已 经 更 新 过 的 数据 项 。 否 则 ，T 只 能 异常 中 止 。SNAPSHOT 
隔离 级 别 的 一 个 实现 (在 24.5 节 中 描述 ) 有 着 一 个 很 好 的 性 质 : 不 需要 写 锁 ， 因 此 读 和 写 都 
不 需要 等 待 。 然 而 ， 当 事务 完成 的 时 候 可 能 会 异常 中 止 。 

先 提 交 者 赢 的 特性 消除 了 丢失 更 新 ， 当 两 个 并 发 的 活动 事务 读 了 同一 个 快照 又 去 写 同一 
个 数据 项 的 时 候 ， 就 会 发 生 技 失 更 新 。 然而 即使 有 了 先 提交 者 赢 协议 ，SNAPSHOT 隔 离 级 别 
也 人 允许 不 可 串 行 化 〈 因 此 可 能 是 错误 的 ) 调度 。 例 如 调度 

r (x) mn O) r (CD rn O) wi O) w (x) 
是 允许 的 ， 但 它 不 是 可 串 行 化 的 ， 因 为 不 可 能 通过 一 系列 的 交换 相 邻 操 作 来 产生 等 价 的 串 行 
调度 。Ti 和 T:? 读 取 同 一 个 快照 ， 但 是 它们 写 了 不 同 的 数据 项 ， 所 以 两 个 操作 都 可 以 提交 。 

SNAPSHOT 隔 离 级 别 的 实现 是 很 复杂 的 ， 因 为 必须 要 维护 多 版 本 数据 库 。 然 而 ， 实 际 上 
不 可 能 维护 所 有 的 版 本 ， 最 终 都 要 丢弃 老 的 版 本 。 这 对 于 长 时 间 运 行 的 事务 来 说 是 一 个 问题 ， 
因为 如 果 它 们 请 求 访问 不 再 存在 的 版 本 ， 它 们 就 必须 要 异常 中 止 。 在 24.5 节 可 以 找到 关于 多 
版 本 并 发 控制 和 SNAPSHOT 隔 离 级 别 的 较为 完整 的 讨论 。 


15.1.6 锁 粒 度 和 意向 锁 


为 了 减少 维护 大 量 锁 的 开销 ， 很 多 商用 并 发 控制 封锁 了 比 单个 数据 项 要 大 的 单元 。 例 如 ， 
并 发 控制 可 能 不 是 封锁 只 占 几 个 字 节 的 数据 项 ， 而 是 封锁 该 数据 项 所 在 的 整个 磁盘 页 。 因 为 
这 样 的 控制 封锁 了 比 实际 需要 更 多 的 数据 项 ， 所 以 它 产生 了 和 只 封锁 请 求 加 锁 的 数据 项 的 并 
发 控制 相同 的 或 者 更 高 的 隔离 级 别 。 类 似 的 ， 并 发 控制 可 能 不 是 在 包含 表 中 若干 元 组 的 页 上 
加 锁 、 而 是 在 整 张 表 上 加 锁 。 

封锁 单元 的 大 小 决定 了 锁 的 粒度 (granularity), 如 果 封 锁 单元 小 ， 则 称 为 细 (fine) 粒度 ， 
否则 就 是 粗 (coarse) 粒度 。 粒 度 形成 了 基于 包含 关系 的 层次 结构 。 通 常 ， 细 粒度 锁 是 元 组 锁 ， 
中 等 粒度 锁 是 在 包含 指定 元 组 的 页 上 的 锁 ， 粗 粒度 锁 是 覆盖 表 的 所 有 页 的 表 锁 。 
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细 粒 度 锁 比 粗 粒 度 锁 具有 更 好 的 并 发 度 ， 因 为 事务 只 封锁 它们 实际 使 用 的 数据 项 。 然 而 ， 
与 细 粒 度 锁 相关 的 开销 就 比较 大 。 事 务 通常 拥有 更 多 的 锁 ， 因 为 单一 的 粗 粒 度 锁 可 能 准予 访 
问 此 事务 用 到 的 几 个 数据 项 。 因 此 ， 在 并 发 控制 中 需要 更 多 的 空间 来 保存 关于 细 粒 度 锁 的 
信息 。 在 为 每 个 单元 请 求 锁 时 也 花费 了 更 多 的 时 间 。 经 过 这 些 权衡 之 后 ， 数 据 库 系统 经 常 在 
不 同 的 级 别 上 提供 不 同 的 粒度 ， 在 同一 个 应 用 程序 中 可 以 使 用 不 同 的 级 别 。 

设置 多 粒度 锁 引 入 了 一 些 新 的 实现 问题 。 假设 事务 Ti 已 经 取得 了 一 张 表 的 某 个 特定 元 组 
的 写 锁 ， 事 务 Ts 请求 在 整 张 表 上 的 读 锁 ( 它 想 读 取 这 张 表 上 所 有 的 元 组 )。 并 发 控制 不 应 该 授 
予 它 表 锁 ， 因 为 不 应 该 允许 T: 读 取 被 Ti 封锁 的 元 组 。 问 题 是 并 发 控制 如 何 检测 到 这 个 冲突 ， 
因为 冲突 的 锁 是 在 加 不 同 的 数据 项 上 的 。 

解决 的 方法 是 有 层次 地 组 织 锁 。 在 取得 细 粒 度数 据 项 (如 一 个 元 组 ) 上 的 锁 之 前 ， 事 务 
必须 首先 取得 包含 粗 粒度 数据 项 (如 表 ) 上 的 锁 。 但 是 这 种 锁 是 什么 类 型 的 呢 ? 显然 ， 不 是 
读 锁 ， 也 不 是 写 锁 ， 因 为 在 那 种 情况 下 获得 额外 的 细 粒 度 锁 是 没有 意义 的 ， 有 效 的 锁 粒 度 应 
该 是 粗糙 的 。 因 此 ， 数 据 库 系 统 提供 了 新 型 的 锁 一 一 意向 锁 (intention lock)。 例 如 ， 在 支持 
元 组 锁 和 表 锁 的 系统 中 ， 在 事务 获得 元 组 上 的 读 (共享 ) 锁 或 者 写 (排他 ) 锁 之 前 ， 它 必须 
获得 包含 那个 元 组 的 表 上 的 意向 锁 。 意 向 锁 是 比 读 锁 和 写 锁 更 弱 的 锁 ， 一 般 分 为 三 种 。 

。 如 果 事 务 想 取得 某 个 元 组 上 的 共享 锁 ， 它 必须 首先 得 到 这 个 表 上 的 意向 共享 锁 

(Intention Shared，IS )。IS 锁 指出 这 个 事务 想 取得 那 张 表 中 的 某 个 元 组 上 的 共享 锁 。 

“如果 事务 想 取得 某 个 元 组 上 的 排他 锁 ， 它 必须 首先 得 到 这 个 表 上 的 意向 排他 锁 

(Intention Exclusive，IX)。IX 锁 指出 这 个 事务 想 取 得 那 张 表 中 的 某 个 元 组 上 的 排他 锁 。 

* 如 果 事 务 想 更 新 表 中 某 些 元 组 , 但 是 需要 读 取 所 有 的 元 组 来 决定 到 底 修改 哪 一 些 (例如 ， 

它 想 修 改 某 一 属性 的 值 小 于 100 的 所 有 元 组 )， 它 必须 首先 取得 这 个 表 上 的 共享 意向 排他 

锁 (Shared Intention Exclusive，SIX)。SIX 锁 是 这 个 表 上 共享 锁 和 意向 排他 锁 的 组 合 。 


这 允许 事务 读 取 这 张 表 上 所 有 的 元 组 ， 随 已 授权 模式 
后 得 到 它 想 更 新 的 那些 元 组 上 的 排他 锁 。 需求 的 模式 IS IX SIX S$ 
在 图 15-3 中 给 出 了 意向 锁 的 冲突 表 。 例 如 ， IS 

它 表明 在 已 经 授予 事务 T, 在 一 张 表 上 的 IX 锁 后 ， Ix 


就 不 能 授予 另 一 个 事务 T 在 那 张 表 上 的 共享 锁 。 
为 了 理解 这 一 点 ， 注 意 共享 锁 克 许 T, 读 取 那 张 表 x 
中 的 所 有 元 组 ， 这 和 T, 正 在 更 新 它们 中 的 一 个 

(或 多 个 ) 元 组 相 冲突 。 另 一 方面 ， 可 以 授予 T B53 意向 锁 的 冲突 表 。 有 冲突 的 

在 不 同 元 组 上 的 排他 锁 ， 但 是 它 必 须 首先 获得 表 MRR ZEIA 表示 

上 的 IX 锁 。 这 不 会 产生 问题 ， 因 为 如 图 所 示 IX 锁 并 不 冲突 。 在 24.3.1 节 中 将 更 详细 地 讨论 多 粒 
度 锁 和 意向 锁 。 


15.1.7 用 意向 锁 的 可 串 行 化 封锁 策略 
如 采 事 务 在 两 阶段 的 方式 中 只 使 用 表 锁 ， 那 么 结果 就 是 可 串 行 化 调度 。 然 而 ， 这 样 的 封 


x x x x x | > 





Ə 例如 ， 一 个 磁盘 页 上 的 元 组 通常 都 是 某 张 表 中 的 元 素 ， 存 取 一 个 这 样 的 元 组 的 事务 也 可 能 存 取 另 一 个 这 样 
的 元 组 。 页 锁 允 许 存 取 这 两 个 元 组 。 
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锁 原 则 会 使 并 发 度 降低 。 另 一 方面 ， 虽 然 页 封锁 或 者 元 组 封锁 更 加 有 效 ， 但 是 可 能 产生 幻影 。 
很 多 商用 系统 使 用 增强 的 细 粒 度 封 锁 策略 来 防止 幻影 从 而 产生 可 串 行 化 调度 。 防 止 幻影 的 基 
本 条 件 是 在 事务 Ti 读 取 了 表 R 中 满足 WHERE 谓 词 P 的 元 组 之 后 ， 直 到 TT 终止 都 没有 其 他 并 发 执 
行 的 事务 T; 可 以 向 R 中 插入 满足 P 的 (幻影 ) 元 组 t。 

该 策略 与 Ti 如 何 存 取 R 有 关 。 在 构造 在 取 满足 P 的 元 组 的 SQL 语句 的 查询 执行 计划 的 时 候 ， 
系统 决定 是 否 可 以 使 用 已 存在 的 索引 。 如 果 没 有 这 样 的 索引 ， 系 统 必须 搜索 R 中 的 每 一 页 ， 来 
定位 满足 P 的 元 组 。 在 这 种 情况 下 ，T, 获 得 R 上 的 S 锁 并 且 保 持 这 个 锁 直 到 Tl, 提交 为 止 。T, 不 能 
插入 t， 因 为 它 首先 需要 获得 R 上 的 〈 相 冲突 的 ) IX 锁 。 因 此 ， 当 不 使 用 索引 的 时 候 ， 不 可 能 
出 现 幻 影 。 

如 果 T, 通 过 索引 来 存 取 R， 那 么 就 不 需要 对 R 进 行 全 部 扫描 ， 这 种 情况 就 更 加 棘手 了 。 例 
如 ， 如 果 Ti 用 谓词 P 来 执行 SELECT 语句 ， 那 么 它 只 获得 R 上 的 IS 锁 。 假 设 系统 实现 了 细 粒 度 
页 锁 ， 那 么 Ti 也 必须 获得 包含 它 通 过 索引 存 取 的 其 中 包含 满足 P 的 元 组 的 R 所 在 页 上 的 S 锁 。 但 
是 ， 这 些 锁 并 不 能 防止 幻影 。 如 果 T? 试 图 插入 幻影 (到 R 中 ， 它 可 以 获得 R 上 的 IX 锁 ， 因 为 那个 
锁 并 和 Ti 拥有 的 IS 锁 并 不 冲突 。 因 此 在 表 这 个 级 别 上 没有 冲突 。 如 果 t 存 储 在 与 Ti 封锁 的 页 不 
同 的 页 上 ， 那 么 在 页 这 个 级 别 上 也 没有 冲突 。 因 此 ，T: 可 能 插入 t。 因 而 ， 需 要 有 一 些 机 制 来 
防止 这 样 的 幻影 。 

用 到 的 机 制 涉及 封锁 索引 结构 本 身 的 部 分 。 当 插入 元 组 到 R 中 时 ， 要 更 新 用 来 存 取 R 的 索 
引 以 包含 对 新 元 组 的 引用 。 因 此 ， 如 果 T! 在 T 为 了 插入 幻影 而 必须 更 新 的 索引 结构 的 页 上 保 
。 持 着 共享 锁 ， 那 么 就 不 能 进行 插入 。 特 别 的 ， 因 为 t 满 足 P，T: 必 须 更 新 的 索引 页 就 是 Ti 必须 存 
取 的 页 ， 并 且 T 在 那些 页 上 保持 着 共享 锁 。 封 锁 协 议 的 细节 依赖 于 用 到 的 索引 的 类 型 ， 这 将 
在 24.3.1 讨 论 。 


15.1.8 总 结 


如 何 为 一 个 特定 应 用 程序 选择 隔离 级 别 是 比较 复杂 的 问题 。 商 用 数据 库 管理 系统 厂商 党 
常 支持 很 多 可 选项 《包括 但 不 仅 限 于 上 面 讨论 的 那些 )， 并 且 和 希望 应 用 程序 设计 者 为 他 们 特定 
的 应 用 程序 选择 一 个 适当 的 隔离 级 别 。 

可 串 行 化 调度 可 以 保证 应 用 程序 的 正确 性 ， 但 是 可 能 无 法 满足 应 用 程序 的 性 能 要 求 。 然 
而 ， 一 些 应 用 程序 在 隔离 级 别 SERIALIAZABLE 时 也 可 以 正确 执行 。 例 如 ， 打 印 储户 邮件 列 
表 的 事务 可 能 不 需要 最 新 的 数据 库 视 图 。 因 此 ， 它 可 以 使 用 短期 读 锁 而 不 使 用 长 期 读 锁 ， 并 
且 可 以 在 READ COMMITTED 上 执行 。24.2.2 节 给 出 了 在 不 同 隔离 级 别 上 正确 运行 的 应 用 程序 
的 例子 。 


15.2 原子 性 和 持久 性 


原子 性 要 求 事务 或 者 成 功 的 完成 并 提交 或 者 异常 中 止 ， 即 撤销 它 对 数据 库 做 过 的 任何 修 
改 。 事 务 可 能 被 用 户 异 常 中 止 〈 可 能 是 使 用 取消 按钮 )， 可 能 被 系统 异常 中 止 (可 能 因为 死 锁 
或 者 因为 某 个 数据 库 更 新 违反 了 约束 检查 )， 或 者 是 自己 异常 中 止 (比如 当 它 发 现 不 想 要 的 数 
据 的 时 候 )。 事 务 不 能 成 功 完成 的 另 一 个 原因 是 在 事务 执行 的 过 程 中 系统 崩溃 。 崩 溃 比 用 户 或 
系统 引发 的 异常 中 止 要 更 复杂 一 些 ， 因 为 存储 在 主 存 中 的 所 有 信息 在 系统 崩溃 的 时 候 都 会 丢 
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失 。 因 此 事务 必须 异常 中 止 ， 而 且 必 须 只 使 用 存储 在 大 规模 存储 器 中 的 信息 来 回 退 它 所 做 过 
的 修改 。 

持久 性 要 求 在 事务 提交 以 后 ， 即 使 存储 数据 库 的 大 规模 存储 器 设备 失效 了 ， 它 对 数据 库 
的 修改 也 不 能 丢失 。 


15.2.1 先 写 日 志 


我 们 在 同一 节 中 讨论 原子 性 和 持久 性 ， 是 因为 它们 经 常 由 同一 个 机 制 一 一 先 写 日 志 来 
实现 。 

日 志 是 一 系列 描述 事务 对 数据 库 更 新 的 记录 。 随 着 事务 的 执行 ， 记 录 就 会 追加 到 日 志 中 ， 
而 且 不 会 改变 。 系 统 会 参考 日 志 来 实现 原子 性 和 持久 性 。 具 备 了 持久 性 ， 在 存储 数据 库 的 大 
规模 存储 器 设备 失效 以 后 ， 可 以 用 日 志 来 恢复 这 个 数据 库 。 因 此 ,日 志 通 常 存储 在 不 同 的 大 
规模 存储 器 设备 上 。 日 志 常 常 是 磁盘 上 的 顺序 文件 ， 它 通常 是 双 工 的 ( 即 具 有 存储 在 不 同 设 
备 上 的 拷贝 )， 所 以 它 在 任何 一 个 介质 失效 以 后 都 还 是 存在 的 。 

实现 原子 性 和 持久 性 常用 的 技术 涉及 到 更 新 (update) 记录 的 使 用 。 在 事务 执行 改变 数据 
库 状 态 的 操作 时 ， 更 新 记录 追加 到 日 志 后 面 。 如 果 操 作 只 是 读 取 数据 库 ， 那 么 不 需要 追加 记 
录 。 每 个 更 新 记录 描述 了 所 做 的 改变 ， 特 别 是 要 包含 足够 的 信息 在 之 后 事务 异常 中 止 的 时 候 
来 使 系统 撤销 所 做 的 改变 。 

有 几 种 方法 来 撤销 改变 。 最 常见 的 是 更 新 记录 中 包含 要 修改 的 数据 库 数 据 项 的 前 像 
(before image)， 即 数据 项 在 修改 之 前 的 物理 拷贝 。 如 果 事 务 异 常 中 止 ， 就 可 以 用 更 新 记录 来 
恢复 这 个 数据 项 到 它 最 初 的 值 一 一 这 就 是 有 时 称 更 新 记录 为 撤销 记录 (undo record) 的 原因 。 
除了 前 像 ， 更 新 记录 还 要 用 事务 识别 号 (transaction Id) 识别 进行 改变 的 事务 和 改变 了 的 数据 
库 数据 项 。 

如 果 事 务 T 异 常 中 止 ， 用 日 志 来 回 退 是 很 方便 的 。 从 后 向 前 扫描 日 志 ， 当 遇 到 T 的 更 新 记 
录 时 ， 就 把 前 像 写 到 数据 库 中 ， 以 便 撤 销 这 个 改变 。 因 为 日 志 可 能 非常 长 ， 所 以 从 后 向 前 扫 
描 到 最 开始 来 保证 处 理 T 的 所 有 更 新 记录 是 不 实际 的 。 为 了 避免 完整 地 从 后 往 前 扫描 ， 当 T 初 
始 化 的 时 候 ， 包 含 事务 识别 号 的 开始 记录 (begin record) 就 要 追加 到 日 志 中 去 。 从 后 向 前 扫 
描 在 遇 到 这 个 记录 的 时 候 就 会 停止 。 

因 岗 溃 而 导致 的 回 退 比 某 个 事务 的 异常 中 止 要 复杂 一 点 ， 因 为 现在 系统 必须 首先 识别 出 
异常 中 止 的 事务 。 特 别 的 ， 系 统 必须 区 分 已 经 完成 的 事务 和 在 发 生 崩溃 时 仍然 活动 的 事务 。 
所 有 活动 的 事务 都 必须 异常 中 止 。 | 

当 事 务 提交 时 ， 它 把 握 交 记录 (commit record) 写 到 日 志 中 。 如 果 它 异常 中 止 ， 那 么 就 
回 退 它 的 更 新 ， 然 后 把 异常 中 止 记 录 (abort record) 写 到 日 志 中 。 使 用 这 些 记录 ， 从 后 向 前 
的 扫描 就 可 以 记录 下 在 崩溃 前 完成 的 事务 的 识别 号 ， 因 此 在 后 面 遇 到 它们 的 更 新 记录 时 就 可 
以 忽略 掉 。 如 果 在 从 后 向 前 的 扫描 中 与 T 相 关 的 第 一 个 记录 是 更 新 记录 ， 那 么 当 崩 涡 发 生 的 时 
候 T 是 活动 的 ， 因 此 必须 异常 中 止 。 

注意 ， 当 T 提 交 时 把 提交 记录 写 进 日 志 是 很 重要 的 。 如 果 我 们 假设 当 T 提 出 写 请 求 的 时 候 
数据 库 是 立即 更 新 的 (并 不 总 是 这 种 情况 )， 那 么 当 T 请 求 提交 的 时 候 ， 所 有 T 请 求 的 数据 库 修 
改 将 会 在 大 规模 存储 器 中 记录 下 来 。 然 而 ， 提 交 请 求 本 身 并 不 能 保证 持久 性 。 如 果 崩 溃 发 生 
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在 事务 提出 这 个 请 求 之 后 ， 但 是 在 提交 记录 写 进 日 志 之 前 ， 那 么 事务 就 会 被 恢复 过 程 异 常 中 
止 ， 这 就 不 是 持久 的 了 。 因 此 ， 实际 上 事务 要 等 到 它 的 提交 记录 已 经 据 加 到 大 规模 存储 器 上 
的 日 志 中 后 才 可 以 提交 。 

和 崩溃 相关 的 最 后 一 个 问题 是 在 恢复 时 避免 做 从 后 向 前 完整 扫描 的 机 制 问题 。 没 有 这 样 
的 机 制 ， 恢 复 过 程 就 无 法 知道 什么 时 候 才 能 停止 扫描 ， 因 为 在 崩溃 时 仍然 医 动 的 事务 可 能 在 
日 志 中 前 面 的 某 点 上 已 经 写 下 了 更 新 记录 ， 然 后 就 设 有 做 进一步 更 新 了 。 因 此 恢复 过 程 除非 
往 回 扫描 到 那 条 记录 ， 否 则 就 找 不 到 这 个 事务 存在 的 痕迹 。 

为 了 处 理 这 种 情况 ， 系 统 周期 性 地 追加 检查 点 记录 (checkpoint record) 到 日 志 中 去 , 在 
其 中 列 出 当前 活动 的 事务 。 恢 复 过 程 至 少 必 须 从 后 向 前 扫描 到 最 近 的 检查 点 记录 。 如 果 T 在 那 
条 记录 中 命名 ， 并 且 从 后 向 前 扫描 没有 遇 到 T 的 提交 记录 或 异常 中 止 记 录 ， 那 么 IT 在 系统 崩溃 
的 时 候 仍 然 是 活动 的 。 从 后 向 前 扫描 必须 在 经 过 检查 点 之 后 还 继续 进行 ， 直 到 遇 到 T 的 开始 记 
录 为 止 。 扫 描 在 考虑 了 所 有 这 样 的 事务 之 后 终止 。 

我 们 已 经 假设 在 数据 库 数 据 项 x 的 新 值 写 进 包含 数据 库 的 大 规模 存储 器 设备 的 时 候 ，x 的 
更 新 记录 也 写 进 包 含 日 志 的 大 规模 存储 器 设备 。 实 际 上 ，x 的 更 新 和 更 新 记录 的 追加 是 以 某 种 
顺序 进行 的 。 考 虑 在 执行 这 些 操作 的 时 候 发 生 崩 久 的 可 能 性 。 如 果 设 有 一 个 操作 完成 ， 那 么 
没有 问题 。 更 新 记录 不 会 出 现在 日 志 中 ,恢复 过 程 也 不 会 撤销 任何 东西 ， 因 为 x 还 没有 被 更 新 。 
如 果 崩 省 发 生 在 两 个 操作 都 完成 之 后 ， 那 么 恢复 过 程 可 以 用 如 上 所 述 的 方法 正确 进行 恢复 。 
然而 ， 假 设 首先 更 新 zx， 然后 在 更 新 和 日 志 追 加 之 间 崩 溃 发 生 。 那 么 恢复 过 程 就 无 法 回 退 这 个 
事务 并 把 数据 库 恢 复 到 一 致 的 状态 ， 因 为 大 规模 存储 器 上 没有 x 最 初 的 值 一 一 这 是 不 可 接受 的 
情况 。 另 一 方面 ， 如 果 首 先 追 加 更 新 记录 ， 就 可 以 避免 这 个 问题 。 在 重启 的 时 候 ， 恢 复 过 程 
只 是 用 更 新 记录 来 恢复 x， 骨 省 发 生 在 x 的 新 值 写 进 数 据 库 之 前 还 是 之 后 都 没什么 区 别 。 如 果 
崩溃 发 生 在 追加 更 新 记录 之 后 ,但 是 在 x 更 新 之 前 ， 那 么 数据 库 中 x 的 值 和 更 新 记录 中 的 前 像 
在 系统 重启 的 时 候 是 相同 的 。 恢复 过 程 使 用 这 个 前 像 来 覆盖 x (这 并 不 改变 它 的 值 )， 但 是 恢 
复 后 的 最 终 状 态 是 正确 的 。 

因此 ， 更 新 记录 必须 总 是 在 更 新 数据 库 之 前 追加 到 日 志 中 去 。 这 被 称 为 先 写 特性 ， 日 志 
被 称 为 先 写 日 志 ( write-ahead log). 

从 崩溃 中 恢复 实际 上 比 我 们 所 描述 的 要 复杂 一 些 。 因 为 性 能 的 原因 ， 大 多 数 数据 库 系 统 
在 主 存 的 页 缓冲 区 中 维护 正在 使 用 的 数据 库 页 的 拷贝 。 对 数据 库 做 的 修改 就 记录 在 这 些 页 中 ， 
它们 不 需要 立即 传送 到 大 规模 存储 器 上 的 实际 数据 库 中 去 。 事 实 上 ， 它 们 可 能 在 主 存 中 保存 
一 段 时 间 ， 以 便 再 次 访问 它们 时 可 以 快速 处 理 。 另 外 ， 因 为 类 似 的 原因 ， 日 志 记 录 也 不 是 实 
时 地 写 到 日 志 中 ， 而 是 临时 存储 在 主 存 的 卓志 缓冲 区 中 。 为 了 避免 为 每 个 更 新 记录 都 对 日 志 
进行 一 次 写 操 作 ， 当 缓冲 区 满 的 时 候 ， 才 把 整个 缓冲 区 写 到 日 志 中 去 。 这 些 缓冲 区 的 操纵 和 
它们 在 更 新 大 规模 存储 器 上 日 志和 数据 库 的 使 用 必须 小 心 调整 以 实现 原子 性 和 持久 性 。 可 以 
在 25.1 和 25.2 节 找到 这 个 问题 较 完 整 的 讨论 。 


15.2.2 从 大 规模 存储 器 失效 中 恢复 


持久 性 要 求 不 可 以 丢失 提交 事务 对 数据 库 所 做 的 修改 。 因 为 大 规模 存储 器 设备 也 可 能 失 
效 ， 所 以 数据 库 必须 元 余地 存储 在 不 同 的 设备 上 。 
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实现 持久 性 的 一 个 简单 途径 是 在 不 同 的 磁盘 上 维护 数据 库 单独 的 拷贝 (可 能 由 不 同 的 电 
源 支持 )， 以 保证 两 个 磁盘 不 可 能 同时 失效 。 镜 像 磁盘 实现 了 这 个 方法 。 镜 像 磁盘 是 大 规模 存 
储 器 系统 ， 它 对 用 户 是 透明 的 ， 只 要 应 用 程序 请 求 磁盘 写 操作 ， 系 统 就 把 相同 的 信息 写 到 两 
个 不 同 的 磁盘 上 ， 因 此 一 个 磁盘 是 额外 的 拷贝 ， 或 者 是 另 一 个 磁盘 的 镜像 。 

在 事务 处 理应 用 程序 中 ， 镜 像 磁 盘 系统 可 以 实现 增强 的 系统 可 用 性 (availability )， 因 为 
如 果 其 中 一 个 镜像 磁盘 失效 ， 系 统 可 以 使 用 另 一 个 磁盘 继续 运行 。 当 更 换 了 失效 磁盘 后 ， 系 
统 必 须 重新 闻 步 这 两 个 磁盘 。 相 比 之 下 ， 当 只 是 使 用 日 志 来 实现 持久 性 的 时 候 (就 像 下 面 要 
描述 的 那样 )， 磁 盘 故 障 后 的 恢复 可 能 需要 比较 长 的 一 段 时 间 ， 在 这 段 时 间 里 ， 用 户 无 法 使 用 
系统 。 

即使 当 事 务 处 理 系统 使 用 镜像 磁盘 的 时 候 ， 它 也 必须 使 用 先 写 日 志 来 实现 原子 性 一 一 例 
如 在 崩溃 后 回 退 事 务 。 

实现 持久 性 的 第 二 种 方法 涉及 到 从 日 志 中 恢复 磁盘 上 的 信息 。 因 为 我 们 不 希望 恢复 过 程 
花费 太 长 的 时 间或 者 日 志 变 得 太 大 ， 所 以 计划 是 周期 性 地 拷贝 或 者 转 储 (dump) 整个 数据 库 
内 容 到 大 规模 存储 器 ， 因 此 就 得 到 了 数据 库 的 快照 。 另 外 ， 除 了 前 像 ， 包 含 被 更 新 数据 项 的 
新 值 的 后 像 (after image) 存储 在 每 个 更 新 记录 中 。 

为 了 从 磁盘 故障 中 恢复 ， 系 统 首先 拷贝 转 储 文 件 到 (新 的 ) 磁盘 上 。 然 后 它 对 日 志 做 两 
遍 扫描 一 一 从 后 向 前 的 扫描 ( 它 列 出 转 储 后 提交 的 所 有 事务 ) 和 从 前 向 后 的 扫描 ( 它 使 用 第 
一 遍 扫 描 得 到 的 事务 的 更 新 记录 的 后 像 ， 来 从 转 储 中 记录 的 状态 向 前 回 退 数据 库 到 发 生 故 障 
时 它 的 提交 值 )。 

在 这 个 方法 中 ， 一 个 很 重要 的 问题 是 如 何 产生 转 储 。 对 于 一 些 应 用 程序 来 说 ， 可 以 在 关 
闭 系统 之 后 离线 产生 ， 此 时 不 允许 有 新 的 事务 进入 ， 人 允许 所 有 现存 的 事务 完成 。 当 进行 转 储 
的 时 候 ， 不 会 有 事务 在 执行 ， 数 据 库 的 状态 变 成 在 转 储 开始 之 前 提交 的 所 有 事务 执行 结果 的 
快照 。 然 而 对 于 很 多 应 用 程序 来 说 ， 系 统 是 不 能 关闭 的 ， 转 储 必须 在 系统 运行 的 时 候 进 行 : 

模糊 转 储 (fuzzy dump) 是 当 系 统 正在 运行 ， 事 务 可 能 正在 执行 的 时 候 进行 的 转 储 。 这 
些 事务 后 来 可 能 提交 也 可 能 异常 中 止 。 用 模糊 转 储 恢复 磁盘 的 算法 必须 适当 地 处 理 这 些 事务 
的 影响 。 可 以 在 25.4 节 中 找到 关于 介质 故障 和 转 储 的 较 完整 的 讨论 。 


15.3 实现 分 布 式 事务 


我 们 已 经 假设 事务 存 取 的 信息 存储 在 一 个 数据 库 系 统 中 ， 但 并 不 总 是 这 样 ， 支 持 大 企业 
的 信息 可 能 存储 在 多 个 数据 库 中 。 例 如 ， 制 造 企业 可 以 有 多 个 数据 库 来 分 别 描述 库存 、 生 产 、 
员工 、 资 金 等 等 。 当 这 些 企业 向 更 高 阶段 集成 的 时 候 ， 事 务 就 必须 存 取 位 于 多 个 数据 库 中 的 
信息 了 。 因 此 ， 启 动 一 个 新 的 零件 装配 的 事务 可 能 通过 更 新 库存 数据 库 来 找到 零件 ， 通 过 存 
取 员 工 数据 库 来 为 这 个 工作 指派 特定 的 员工 ， 还 要 在 生产 数据 库 中 创建 一 条 记录 来 描述 这 个 
新 的 活动 。 这 种 类 型 的 系统 称 为 多 数据 库 (multidatabase) 系统 。 我 们 将 在 第 18 章 讨论 这 样 
的 多 数据 库 系统 的 数据 库 和 查询 设计 问题 。 在 这 一 节 中 ， 我 们 讨论 与 事务 相关 的 问题 。 

存 取 多 数据 库 系统 的 事务 通常 被 称 为 全 局 (global) 事务 ， 因 为 它们 可 以 存 取 企业 的 所 有 
数据 。 因 为 数据 库 经 常 位 于 网 络 的 不 同 站 点 ， 所 以 这 样 的 事务 也 称 为 分 布 式 (distributed) 事 
务 。 设 计 全 局 事务 时 的 很 多 考虑 并 不 依赖 于 这 些 数据 是 否 是 分 布 的 ， 所 以 这 两 个 术语 经 常 是 
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AREA. BMAD MA TORK (MEK. Ww) 和 性 能 问题 ， 这 
些 问 题 在 所 有 数据 库 都 存储 在 同一 个 站 点 时 是 不 会 出 现 的 。 

我 们 假设 ， 多 数据 库 中 的 每 个 数据 库 输出 一 组 可 以 用 来 存 取 它 的 数据 的 (局 部 ) 事务 。 例 
如 ， 银 行 支行 可 能 通过 储 蔷 和 取款 事务 来 存 取 它 维护 的 账户 。 可 以 在 本 地 调用 这 样 的 事务 来 反 
映 纯 本 地 的 事件 (比如 ， 在 本 地 支行 发 生 的 存储 到 本 地 支行 账户 的 储 著 )， 或 者 通过 远程 调用 
来 作为 分 布 式 事务 的 一 部 分 (比如 ， 把 钱 从 一 个 支行 的 一 个 账户 转 到 另 一 个 支行 的 一 个 账户 )。 
当 一 个 站 点 的 事务 作为 分 布 式 事务 的 一 部 分 执行 的 上 时候， 我 们 称 其 为 子 事务 (subtransaction ) 。 

每 个 站 点 的 数据 库 都 有 它 自 己 的 与 存储 该 站 点 的 数据 相关 的 本 地 完整 性 约束 。 多 数据 库 
可 能 也 有 与 不 同 站 点 的 数据 相关 的 全 局 完整 性 约束 。 例 如 ， 银 行 总 部 的 数据 库 可 能 包含 一 个 
数据 项 ， 它 的 值 是 所 有 本 地 支行 的 数据 库 中 存款 的 总 和 。 我 们 假设 每 个 分 布 式 事务 都 是 一 致 
的 。 每 个 子 事务 维护 着 执行 它 的 站 点 的 局 部 完整 性 约束 ， 分 布 式 事务 的 所 有 子 事务 一 起 来 维 
护 全 局 完整 性 约束 。 

在 多 数据 库 系 统 上 实现 分 布 式 事务 的 目标 是 保证 它们 是 全 局 原子 的 、 隔 离 的 、 持 久 的 和 
一 臻 的。 我们 已 经 看 到 设计 者 经 常 选择 在 一 个 站 点 降低 隔离 级 别 来 执行 事务 以 增强 系统 性 
能 。 就 分 布 式 事务 来 说 ， 有 了 时 不 仅 需 要 降低 隔离 级 别 ， 而 且 还 需要 牺牲 原子 性 和 隔离 性 。 
为 了 更 好 地 理解 下 面 的 问题 ， 我 们 首先 给 出 保证 全 局 原子 性 的 可 串 行 化 的 分 布 式 事务 所 要 
求 的 技术 。 


15.3.1 原子 性 和 持久 性 一 一 两 阶段 提交 协议 


为 了 保证 分 布 式 事务 T 的 原子 性 ，T 的 所 有 子 事务 必须 或 者 都 提交 ， 或 者 都 异常 中 止 。 
此 ， 即 使 一 些 子 事务 成 功 完 成 ， 它 也 不 能 马上 提交 ， 因 为 了 的 另 一 个 子 事务 可 能 异常 中 止 。 如 
果 是 这 样 的 话 ，T 的 所 有 子 事务 都 必须 异常 中 止 。 例 如 ， 如 果 T 是 在 不 同 站 点 的 两 个 账户 之 间 
转账 的 分 布 式 事务 ， 假 定 在 一 个 站 点 上 存款 的 子 事务 异常 中 止 ， 我 们 不 希望 在 另 一 个 站 点 上 
的 取款 子 事务 提交 。 

负责 保证 分 布 式 事务 原子 性 的 事务 处 理 系统 的 一 部 分 是 事务 管理 器 (transaction 
manager )。 它 的 一 个 任务 就 是 跟踪 每 个 分 布 式 事务 有 了 哪个 站 点 参与 。 当 T 的 所 有 子 事务 都 完成 
并 且 T 请 求 提交 的 时 候 ， 它 会 通知 事务 管理 器 。 为 了 保证 原子 性 ， 事 务 管理 器 和 执行 子 事务 的 
数据 库 系 统 遵循 一 个 协议 ， 即 两 阶段 提交 协议 (two-phase commit protocol) [Gray 1978, 
Lampson and Sturgis 1979]。 在 描述 两 阶段 提交 协议 的 时 候 ， 习 惯 上 称 事务 管理 器 为 协调 者 
(coordinator ) ， 称 数据 库 系 统 为 参与 者 (cohort ) 。 

在 协议 的 第 一 阶段 ， 协 调 者 给 T 的 所 有 参 与 者 发 送 准备 好 (prepare) 消息 ， 通 知 它们 准备 
好 提交 。 每 个 参与 者 用 投票 (vote) 消息 来 回复 。 肯 定投 票 表明 参与 者 已 经 准备 好 提交 。 否 
决 投票 表明 参与 者 已 经 异常 中 止 了 这 个 子 事务 。 例 如 ， 来 自 协调 者 的 准备 好 消息 可 能 会 使 参 
与 者 计算 一 个 推迟 了 的 完整 性 约束 。 如 果 参 与 者 发 现 违 反 了 约束 ， 那 么 就 回 退 子 事务 并 发 送 
否决 的 投票 。 参 与 者 崩溃 或 者 没有 回复 消息 会 被 协调 者 解释 为 否决 投票 。 

一旦 站 点 $ 的 参与 者 回复 说 它 准 备 提交 ， 那 么 决定 就 不 能 逆转 了 (BNE LARTER HEE 
的 状态 ) ， 因 为 协调 者 根据 它 收 到 的 投票 的 准确 性 来 决定 将 分 布 式 事务 提交 还 是 异常 中 止 。 特 
别 的 ， 不 允许 站 点 S 的 并 发 控制 随后 异常 中 止 这 个 子 事务 。 另 外 ， 所 有 由 子 事务 执行 的 更 新 必 
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须 在 发 送 准 备 好 投票 之 前 存储 到 非 易 失 性 存储 器 中 去 ， 这 样 ， 如 果 事 务 管 理 器 决定 提交 分 布 
式 事 务 但 是 参与 者 随后 崩溃 了 ， 那 么 还 可 以 在 恢复 的 时 候 提 交 子 事务 。 

如 果 协 调 者 收 到 了 所 有 参与 者 的 准备 好 投票 ， 那 么 它 就 提交 T， 并 给 每 个 参与 者 发 送 提 交 
(commit) 消息 ， 通知 它 们 提交 各 自 的 子 事务 。 因 为 在 投票 之 后 就 不 可 能 异常 中 止 子 事 务 ， 所 
以 可 以 在 收 到 消息 的 时 候 提 交 它 。 然 后 ， 参 与 者 给 协调 者 发 送 完成 (done) 消息 ， 表 明 它 已 
经 完成 协议 中 它 的 那 部 分 。 当 协调 者 收 到 每 个 参与 者 的 完成 消息 时 ， 协 议 就 终止 了 。 

如 果 协 调 者 从 一 个 参与 者 那里 收 到 异常 中 止 投票 ， 那 么 它 就 异常 中 止 分 布 式 事务 ， 并 给 其 
他 的 参与 者 发 送 异 常 中 止 (abort) 消息 。 当 参与 者 收 到 异常 中 止 消息 时 ， 它 就 异常 中 止 子 事务 。 

对 每 个 参与 者 来 说 ， 给 协调 者 发 送 肯 定投 票 消息 和 从 协调 者 那里 收 到 提交 或 异常 中 止 消 
息 的 间隔 称 为 不 确定 时 期 (uncertain period ) ， 因 为 参与 者 不 能 确定 协议 的 结果 。 参 与 者 在 这 
段 时 期 依赖 于 协调 者 ， 因 为 它 不 能 提交 或 异常 中 止 子 事务 。 子 事务 拥有 的 锁 不 能 释放 ， 直 到 
协调 者 回复 为 止 〈《 因 为 协调 者 可 能 决定 异常 中 止 ， 由 子 事务 写 的 新 值 在 那 种 情况 不 应 该 是 可 
见 的 )。 这 就 给 性 能 带 来 了 负面 影响 ， 参 与 者 被 称 为 阻塞 (blocked) 了 。 不 确定 时 期 可 能 很 
长 ， 因 为 在 协议 中 有 通信 延 时 。 

协调 者 也 可 能 会 崩溃 或 者 因为 在 这 段 不 确定 时 期 通信 失败 而 变 成 不 可 用 。 因 为 协调 者 可 
能 已 经 决定 提交 或 者 异常 中 止 事务 ， 然 后 在 它 发 送 提 交 或 者 异常 中 止 消息 给 所 有 参与 者 之 前 
崩 注 了 ， 所 以 参与 者 不 得 不 维持 阻塞 直到 它 发 现 (如 果 可 能 的 话 ) 已 经 做 出 了 什么 决定 为 止 。 
这 个 过 程 可 能 也 要 持续 很 长 的 时 间 。 因 为 这 么 长 的 延 时 通常 在 性 能 上 是 不 可 接受 的 ， 所 以 很 
多 系统 当 不 确定 时 期 超过 某 个 事先 设 定 的 时 间 时 就 抛弃 这 个 协议 (可 能 还 有 原子 性 )， 而 只 是 
提交 或 异常 中 止 本 地 参与 者 的 子 事务 (即使 其 他 子 事务 可 能 已 经 以 不 同 的 方法 终止 了 )。 

在 一 些 情况 下 ， 站 点 管理 者 可 能 拒绝 数据 库 管 理 系统 参与 两 阶段 提交 协议 ， 因 为 它 对 性 
能 可 能 有 负面 的 影响 。 在 另 一 些 情 况 下 ， 站 点 不 能 参与 是 因为 数据 库 管理 系统 是 较 早 的 遗留 
(legacy) 系统 ， 它 不 支持 这 个 协议 。 也 可 能 客户 端的 软件 (如 ODBC 或 JDBC) 不 支持 这 个 协 
议 。 在 这 种 情况 下 ， 就 不 能 实现 全 局 原子 性 了 。 

可 以 在 26.2 节 找到 关于 两 阶段 提交 协议 完整 的 讨论 。 


15.3.2 全 局 可 串 行 性 和 死 锁 


多 数据 库 系统 的 每 个 站 点 都 可 能 维护 着 它 自 己 本 地 的 严格 两 阶段 封锁 并 发 控制 ， 这 个 并 
REAR ERAS LTRS EREN. TEL, SAAS IEM EAST Bh 
的 子 事务 之 间 的 死 锁 。 

1. 会 局 可 串 行 性 

为 了 保证 分 布 式 事务 的 可 串 行 性 ， 我 们 必须 保证 不 仅 每 个 站 点 上 的 子 事务 是 可 串 行 化 的 ， 
而 且 在 所 有 站 点 上 都 有 某 种 全 局 可 串 行 性 。 例 如 ， 我 们 不 希望 站 点 A 的 并 发 控制 以 某 个 顺序 串 - 
行 化 A 上 的 T, 和 T, 的 子 事务 ， 而 站 点 B 的 并 发 控制 以 相反 的 顺序 串 行 化 B 上 的 Ti 和 T: 的 子 事务 。 
在 这 种 情况 下 ， 不 可 能 有 全 局 的 可 串 行 性 。 : 

令 人 奇怪 的 是 ， 除 了 我 们 已 经 讨论 过 的 机 制 ， 没 有 其 他 的 机 制 可 以 实现 全 局 可 串 行 性 : 


如 果 每 个 站 点 的 并 发 控制 独立 地 使 用 严格 的 两 段 锁 协 议 来 本 地 串 行 化 子 事 务 ， 并 且 
用 两 阶段 提交 协议 来 提交 全 局 事务 ， 那 么 全 局 事务 在 它们 提交 的 顺序 上 (FH) 是 
可 串 行 化 的 。[Weihl 1984] 
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”我 们 将 在 26.5 节 给 出 这 段 话 的 证 明 。 

我 们 已 经 讨论 了 不 能 实现 两 阶段 提交 协议 的 情况 。 在 这 种 情况 下 ， 不 能 保证 全 局 事务 是 
全 局 原子 性 的 或 者 全 局 可 串 行 化 的 。 

2. 全 局 死 锁 

分 布 式 系统 容易 产生 涉及 不 同 站 点 的 子 事务 的 某 种 类 型 的 死 锁 。 例 如 ， 站 点 A 上 的 Ti 的 一 
个 子 事务 可 能 在 等 待 A 上 T, 的 一 个 子 事务 拥有 的 一 个 锁 ， 然 而 站 点 B 上 的 T, 的 一 个 子 事务 可 能 
在 等 待 B 上 的 Ti 的 一 个 子 事务 拥有 的 一 个 锁 。 因 为 全 局 事务 的 所 有 子 事务 必须 同时 提交 ， 所 以 
Ti 和 T: 就 进入 了 分 布 式 的 死 锁 一 一 它们 都 将 永远 等 待 下 去 。 系 统 必须 有 某 种 机 制 来 检测 全 局 
死 锁 并 异常 中 止 等 待 循环 中 的 一 个 事务 。 一 个 简单 的 机 制 就 是 超时 。 如 果 一 个 站 点 上 的 子 事 
务 等 待 了 足够 长 的 时 间 ， 那 么 在 那个 站 点 上 的 控制 就 异常 中 止 这 个 事务 。26.4 节 将 会 更 详尽 
地 讨论 这 个 问题 。 


15.3.3 复制 


在 分 布 式 系统 中 ， 数 据 项 的 拷贝 可 以 存储 在 网 络 的 不 同 站 点 上 。 移 动 系统 中 的 站 点 可 能 
断 开 网 络 连接 很 长 一 段 时 间 ， 所 以 它们 就 经 常 这 么 做 。 在 断 开 连 接 之 前 ， 站 点 将 制作 一 份 它 
在 断 开 连 接 的 状态 下 可 能 会 用 到 的 数据 的 拷贝 。 复 制 有 两 个 潜在 的 优点 。 它 可 以 减少 存 取 数 
. 据 项 所 花 的 时 间 ， 因 为 事务 可 以 存 取 最 近 的 (甚至 可 能 就 是 本 地 的 ) 拷贝 。 它 还 可 以 在 发 生 
故障 的 情况 下 改善 数据 项 的 可 用 性 ， 因 为 如 果 一 个 包含 复制 的 站 点 崩溃 ， 那 么 仍然 可 以 用 另 
一 个 站 点 上 的 不 同 复 本 来 存 取 这 个 数据 项 。 

在 复制 的 大 多 数 实现 中 ， 单 独 的 事务 不 会 感知 到 复 本 的 存在 。 系 统 知道 复制 了 哪个 数据 
项 以 及 这 个 复 本 存储 在 哪里 。 应 用 读 一 个 / 写 全 部 (read-one/write-all) 的 复制 算法 ， 当 事务 
请 求 读 取 数据 项 的 时 候 ， 系 统 从 最 近 的 复 本 那里 得 到 它 的 值 ， 当 事 务 请 求 更 新 数据 项 的 时 候 ， 
系统 更 新 所 有 的 复 本 。 系 统 负责 实现 复制 算法 的 部 分 称 为 复 本 控制 (replica control), 

读 一 个 / 写 全 部 的 复制 可 以 提高 速度 ， 利 用 它 可 以 满足 非 复制 系统 上 的 读 请 求 ， 因 为 没有 
复制 ， 读 请 求 可 能 要 求 与 远程 的 数据 库 进行 通信 。 然 而 ， 写 请 求 的 性 能 可 能 会 降低 ， 因 为 必 
须要 更 新 所 有 的 复 本 。 因 此 ， 在 读 比 写 要 频繁 得 多 的 应 用 中 ， 利 用 读 一 个 / 写 全 部 复制 会 提高 
性 能 。 

读 一 个 / 写 金 部 的 系统 可 以 分 为 同步 更 新 和 异步 更 新 。 

。 同步 更 新 系统 当 事 务 更 新 一 个 数据 项 的 时 候 ， 要 在 事务 提交 之 前 更 新 所 有 的 复 本 。 因 

此 对 复 本 的 更 新 和 对 其 他 数据 项 更 新 的 方法 相同 。 基 于 两 段 锁 和 两 阶段 提交 协议 的 同步 

更 新 系统 会 产生 全 局 可 串 行 化 的 调度 。 

“异步 更 新 系统 在 事务 提交 之 前 只 更 新 一 个 复 本 ， 其 他 的 复 本 在 事务 提交 之 后 由 另 一 个 

程序 来 更 新 ， 这 个 程序 由 提交 操作 来 触发 或 者 每 隔 固定 的 一 段 时 间 周 期 性 执行 。 因 此 ， 

即使 在 基于 两 段 锁 协议 和 两 阶段 提交 协议 的 系统 中 ， 调 度 也 可 能 不 是 全 局 可 串 行 化 的 。 

例如 ， 事 务 T! 可 能 更 新 数据 项 x 和 y， 然 后 提交 。 事 务 T; 可 能 从 已 经 更 新 了 的 一 个 复 本 中 

读 取 x 的 值 ， 而 从 没有 更 新 的 一 个 复 本 中 读 取 y 的 值 。 

异步 更 新 系统 又 分 为 两 类 。 

“事务 可 以 封锁 并 更 新 任何 复 本 (假定 是 最 近 的 一 个 )。 在 事务 提交 之 后 ， 更 新 异步 地 传 
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播 到 其 他 的 复 本 。 结 果 ， 并 发 执行 的 事务 可 能 更 新 了 同一 个 数据 项 不 同 的 复 本 。 由 这 些 
事务 产生 的 新 值 最 终 会 到 达 每 个 复 本 ， 但 是 可 能 是 以 不 同 的 顺序 到 达 。 每 个 复 本 站 点 必 
须 决 定 首先 执行 哪个 更 新 ， 或 者 是 否 丢弃 整个 更 新 。 这 就 要 求 利用 冲突 解决 策略 来 处 理 
这 种 情况 。 因 为 没有 策略 可 以 保证 对 所 有 的 应 用 程序 都 是 正确 的 ， 所 以 商用 系统 提供 了 
几 种 特别 的 策略 ， 包 括 “ 最 早 更 新 赢 、“ 最 新 更 新 赢 "、 “最 高 优先 级 站 点 赢 ” 以 及 “用 
户 提供 冲突 解决 的 过 程 ”。 注 意 ， 这 种 形式 的 复制 可 能 会 引起 丢失 更 新 问题 。 
“每 个 数据 项 有 一 个 唯一 的 复 本 被 指派 为 主持 贝 (primary copy)， 所 有 其 他 的 复 本 被 指派 
ABI (secondary copy)。 要 求 更 新 一 个 数据 项 的 事务 必须 封锁 并 更 新 它 的 主 拷贝 。 
利用 这 种 方法 ， 可 以 检测 到 写 冲 突 ， 并 且 可 以 用 特定 的 顺序 来 进行 更 新 。 当 事务 提交 的 
时 候 ， 对 主 拷贝 的 更 新 就 传播 到 其 他 的 复 本 。 当 更 新 主 拷 贝 的 事务 提交 时 ， 可 能 通过 触 
发 单个 事务 来 更 新 副 拷 贝 。 通 过 主 拷贝 来 排序 更 新 ， 这 个 算法 可 以 保证 所 有 的 复 本 看 到 
相同 次 序 的 更 新 ， 因 而 不 需要 任何 冲突 解决 策略 。 通 过 存 取 最 近 的 复 本 来 满足 读 请 求 是 
常见 的 方式 。 
因为 异步 更 新 比 同步 更 新 有 着 更 大 的 事务 吞吐 量 ， 所 以 它 是 使 用 最 为 广泛 的 复制 形式 。 
然而 ， 设 计 者 应 该 知道 异步 更 新 系统 (即使 是 主 找 贝 系统 ) 也 可 能 产生 不 可 串 行 化 的 调度 ， 
因此 可 能 产生 错误 的 结果 。 可 以 在 26.7 节 中 找到 关于 复制 的 更 为 完整 的 讨论 。 


15.3.4 总 结 


分 布 式 事务 处 理 系 统 的 许多 方面 非常 简单 。 每 个 站 点 上 的 并 发 控制 可 以 是 严格 的 两 段 锁 
协议 。 两 阶段 提交 协议 可 以 在 提交 时 用 来 同步 参与 者 。 可 以 用 超时 来 解决 全 局 死 锁 。 

简单 的 结果 是 全 局 支持 可 串 行 化 调度 的 分 布 式 事务 处 理 系统 可 以 通过 将 包含 不 同 厂商 开 
发 的 数据 库 管理 器 的 站 点 互 连 来 实现 ， 只 要 满足 如 下 要 求 即 可 : 

“所 有 的 数据 库 管 理 器 实现 严格 的 两 段 锁 并 发 控制 。 

* 每 个 站 点 参加 两 阶段 提交 协议 。 

这 些 思想 大 大 的 简化 了 分 布 式 系统 的 设计 。 

通常 这 些 条 件 是 不 成 立 的 。 在 一 些 站 点 上 ， 应 用 程序 可 能 使 用 较 低 的 隔离 级 别 ， 站 点 可 
能 不 参与 两 阶段 提交 协议 ， 可 能 使 用 异步 复制 。 在 这 种 情况 下 ， 就 不 能 保证 分 布 式 事务 的 执 
行 是 可 串 行 化 的 。 然 而 ， 可 能 必须 在 这 些 约束 下 设计 系统 ， 应 用 程序 设计 者 也 必须 仔细 评估 
不 可 串 行 化 调度 对 于 数据 库 的 正确 性 和 应 用 程序 的 最 终 效用 的 影响 。 


15.4 参考 书目 


可 以 在 [Gray and Reuter 1993] 中 找到 有 关 实 现 分 布 式 事务 问题 的 全 面 论 述 。[Ceri and Pelagatti 
1984] 在 理论 上 加 以 深化 ， 并 描述 了 实现 的 算法 。[Eswaran et al. 1976] 中 引入 了 两 段 锁 。[Gray et al. 
1976] 中 讨论 了 隔离 级 别 。[Gray 1978, Lampson and Sturgis 1979] 介 绍 了 两 阶段 提交 协议 。[Weihl 1984] 
中 有 两 阶段 提交 协议 和 两 段 锁 的 局 部 并 发 控制 可 以 保证 全 局 可 串 行 性 的 证 明 。 可 以 在 [Gray 1978] 中 找到 
关于 日 志和 恢复 技术 的 讨论 。[Haerder and Reuter 1983]、[Bernstein and Newcomer 1997] 和 fGray and 
Reuter 1993] 中 对 技术 进行 了 详细 的 总 结 。[Stonebraker 1979] 中 引入 了 主 拷贝 复制 。 
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15.5 练习 


15.1 


15.2 
15.3 


15.4 


15.5 


15.6 
15.7 


15.8 


15.9 


15.10 


15.11 


15.12 


15.13 
15.14 
15.15 
15.16 


15.17 
15.18 


说 明 下 面 哪 个 调度 是 可 串 行 化 的 。 

an Wn On @ pn a)n O) 

b. ri (x) We (y) ri (2) Fs (2) wz (x) r: O) 

cn (4) wz O) ri 2) r3 (2) wi (D r2 O) 

d. ri (x) £2 Gy) (2) r (Zz) Wi (x) wz O) 

e. Wi (x) r2 (Y) t: (2) rs (2) r: (x) wz O) 

在 学 生 注册 系统 中 ， 举 出 一 个 会 发 生死 锁 的 调度 的 例子， 

给 出 一 个 调度 的 例子 ， 它 可 能 是 由 非 严格 的 两 段 锁 并 发 控制 产生 的 ， 它 是 可 串 行 化 的 ， 但 不 是 以 

提交 的 顺序 。 

给 出 一 个 你 接触 过 的 事务 处 理 系统 ( 除 银行 系统 以 外 ) 的 例子 ， 对 于 它 你 希望 串 行 了 顺序 就 是 提交 

顺序 。 

假设 你 的 大 学 的 事务 处 理 系统 包含 了 一 张 表 ， 表 中 为 每 个 当前 的 学 生 设置 一 个 元 组 。 

a. 估计 存储 这 张 表 需要 多 少 磁 盘 空 间 。 

b. 给 出 学 生 注 册 系 统 中 事务 的 例子 ， 如 果 使 用 表 封 锁 并 发 控制 ， 那 么 就 要 封锁 整 张 表 。 

给 出 一 个 在 READ COMMITTED 隔 离 级 别 上 会 发 生 丢 失 更 新 的 事务 的 例子 。 

给 出 在 REPEATABLE READ 隔 离 级 别 上 的 调度 的 例子 ， 它 在 运行 SELECT 语句 之 后 就 插 人 了 一 个 

幻影 ， 并 且 l 

a. 得 到 的 调度 是 非 可 串 行 化 的 ， 也 是 不 正确 的 。 

b. 得 到 的 调度 是 可 串 行 化 的 ， 因 而 也 是 正确 的 。 

给 出 在 SNAPSHOT 隔 离 级 别 上 调度 的 例子 ， 并 且 

a. 它 是 可 串 行 化 的 ， 因 而 也 是 正确 的 。 

b. 非 可 串 行 化 的 ， 也 是 不 正确 的 。 

给 出 满足 下 面条 件 的 调度 的 例子 : 

a. 在 SNAPSHOT 隔 离 级 别 上 ， 人 得 不 是 REPEATABLE READ. 

b. 在 SERIALIZABLE 隔 离 级 别 上 ， 但 不 是 在 SNAPSHOT 隔 离 级 别 上 (提示 : 了 在 Ti 提交 后 执行 了 
一 个 写 操作 ) 。 

a. 给 出 一 个 涉及 两 个 事务 的 调度 的 例子 ， 其 中 两 段 锁 并 发 控制 使 得 其 中 一 个 事务 等 待 ， 但 是 实现 
SNAPSHOT 隔 离 级 别 的 控制 使 其 中 一 个 事务 异常 中 止 。 

b. 举 出 一 个 涉及 两 个 事务 的 调度 的 例子 ， 其 中 两 段 锁 并 发 控制 使 得 其 中 一 个 事务 异常 中 止 (因为 
死 锁 ) ， 但 是 实现 SNAPSHOT 隔 离 级 别 的 控制 允许 两 个 事务 都 提交 。 

某 个 只 读 事 务 读 取 了 前 一 个 月 中 输入 数据 库 的 数据 ， 并 用 它 来 准备 一 个 报告 。 可 以 运行 这 个 事务 
的 最 低 的 隔离 级 别 是 什么 ?解释 你 的 原因 。 

当 使 用 在 15.1.4 节 中 给 出 的 封锁 实现 时 ， 在 REPEATABLE READ 上 运行 的 事务 中 的 读 操作 必须 获 
得 什么 意向 锁 ? 

解释 事务 的 提交 是 如 何在 日 志 系统 中 实现 的 。 

解释 为 什么 先 写 日 志 需 要 先 写 特 性 。 

解释 为 什么 在 两 阶段 提交 协议 中 的 参与 者 直到 它 的 不 确定 时 期 结束 后 才能 释放 子 事务 获得 的 锁 。 
两 个 分 布 式 事务 运行 在 相同 的 两 个 站 点 上 。 每 个 站 点 使 用 严格 的 两 段 锁 并 发 控制 ， 整 个 系统 使 用 
两 阶段 提交 协议 。 给 出 一 个 运行 这 些 事务 的 调度 ， 它 们 在 每 个 站 点 上 的 提交 顺序 是 不 同 的 ， 但 是 
全 局 调度 是 可 串 行 化 的 。 , 

给 出 一 个 不 正确 调度 的 例子 ， 它 可 能 是 由 异步 更 新 复制 系统 产生 的 。 

解释 如 何 用 触发 器 来 实现 同步 更 新 复制 系统 。 





第 三 部 分 


数据 库 的 高 级 主题 


第 三 部 分 讨论 一 些 更 高 级 的 主题 。 

这 一 部 分 将 具体 讨论 面向 对 象 数据 库 、 半 结构 化 数据 和 XML 数 
据 库 、 分 布 式 数据 库 、 联 机 分 析 处 理 和 数据 挖掘 。 

作为 独立 的 数据 库 产品 以 及 已 有 的 关系 数据 库 产品 的 扩充 ， 对 象 
数据 库 开 始 找到 其 通 向 主流 数据 库 的 道路 。 我 们 将 在 第 16 章 学 习 对 
象 数据 模型 的 基本 原理 和 相应 的 查询 语言 ， 以 及 这 些 原理 在 现 有 标 
准 中 的 体现 。 

XML 数据 库 代 表 一 个 正在 形成 的 领域 ， 一 旦 基本 标准 和 工具 发 
RRA, XML 将 是 一 个 非常 重要 的 领域 。 第 17 章 将 讨论 一 些 正在 形 
成 的 标准 和 应 用 。 

与 对 象 数据 库 一 样 ， 分 布 式 数据 库 在 许多 应 用 中 变 得 愈加 重要 。 
第 18 章 将 讨论 分 布 式 数 据 库 设计 、 查 询 设 计 和 查询 优化 。 

数据 库 技术 的 其 他 一 些 应 用 包括 数据 仓库 、 联 机 分 析 处 理 
(OLAP)、 数 据 挖掘 。 数 据 仓库 是 一 种 为 处 理 复杂 只 读 查 询 进行 了 优 
化 的 数据 库 系统 ， 这 种 只 读 查 询 主 要 应 用 于 复杂 的 决策 支持 系统 
(如 对 公司 销售 情况 按 区 域 和 时 段 的 合计 查询 ) 。 第 19 章 将 讨论 可 以 
简化 这 些 查询 和 提高 系统 性 能 的 数据 结构 、 语 言 构 造 和 算法 。 





第 16 章 对 象 数据 库 


本 章 介绍 对 象 数据 库 。 首 先 讨 论 关系 数据 模型 的 缺点 ， 这 些 缺 点 的 存在 推动 了 对 更 加 丰 
富 的 数据 模型 的 需求 。 与 关系 数据 库 不 同 ， 对 象 数据 库 有 许多 标准 ， 这 使 得 不 同 技术 之 间 
的 关系 难以 理解 。 为 了 更 好 地 学 习 对 象 数据 库 ， 我 们 先 介绍 一 个 不 参考 其 他 具体 的 标准 和 
语言 的 对 象 数据 库 的 概念 数据 模型 。 然 后 给 出 该 领域 的 两 个 主要 标准 : ODMG 和 SQL:1999 
的 对 象 关系 扩充 ， 并 通过 概念 对 象 模型 对 他 们 各 自 的 特点 进行 解释 。 本 章 的 最 后 将 介绍 
CORBA 一 一 由 对 象 管理 组 织 为 推动 分 布 式 客户 /服务 器 应 用 的 开发 而 提出 的 标准 。 尽 管 
CORBA 不 是 一 个 纯 数据 库 标准 ， 但 是 它 可 以 作为 开发 分 布 式 对 象 数据 服务 的 框架 ， 因 此 与 
本 章 相 关 。 


16.1 关系 数据 模型 的 缺点 


由 于 关系 数据 库 管理 系统 的 基本 关系 模型 比较 简单 (对 应 用 开发 者 具有 吸引 力 ) 以 及 表 
成 为 商业 应 用 中 的 大 多 数 数据 的 合适 的 表示 形式 ，20 世 纪 80 年 代 ， 关 系数 据 库 系统 风靡 整个 
数据 库 市 场 。 受 这 种 商业 上 的 成 功 的 鼓舞 ， 人 们 试图 把 关系 数据 库 应 用 于 其 他 -一些 非 关系 模 
型 的 领域 ， 如 计算 机 辅助 设计 (CAD) 和 地 理 数据 。 关 系数 据 库 很 快 显示 出 并 不 适用 于 这 些 
“ 非 传统 ”的 应 用 。 甚 至 在 核心 应 用 领域 ， 关 系数 据 库 也 有 一 些 缺 陷 。 本 节 用 一 些 简单 示例 来 
说 明 关系 数据 模型 的 问题 。 

1 集合 -- 值 属性 

考虑 如 下 的 使 用 社会 保险 号 、 姓 名 、 电 话 号 码 、 子 女 情况 来 描述 的 人 的 关系 模式 : 


PERSON (SSN: String, Name: String, PhoneN: String, Child: String) 


假设 一 个 人 可 以 有 多 个 电话 号 码 和 多 个 子女 ， 并 且 Child 是 关系 Person 的 一 个 外 键 。 所 以 这 个 
模式 的 键 包含 属性 SSN、PhoneN 和 Child。 下 图 所 示 是 该 模式 的 一 个 可 能 的 关系 实例 9 : 













































这 Ta 
111-22-3333 Joe Public 516-123-4567 222-33-4444 
111-22-3333 Joe Public 516-345-6789 222-33-4444 
111-22-3333 Joe Public 516-123-4567 333-44-5555 
111-22-3333 Joe Public 516-345-6789 333-44-5555 
222-33-4444 Bob Public 212-987-6543 444-55-6666 
222-33-4444 Bob Public 212-987-1111 555-66~7777 
222-33-4444 Bob Public 212-987-6543 555-66-7777 

Bob Public 212-987-1111 444-55-6666 


L 222-33-4444 











O 为 了 简单 起 见 ， 忽 略 了 一 些 用 于 满足 外 键 约束 的 元 组 。 
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由 于 存在 如 下 的 函数 依赖 ， 这 个 模式 不 是 第 三 范式 。 

SSN — Name 
因为 SSN 不 是 键 并 且 Name 不 是 键 所 包含 的 属性 。 而 且 容 易 验证 ， 如 果 首 先 在 SSN、NAME、 
PhoneN 和 SSN、Name、Child 上 进行 投影 来 分 解 这 个 关系 ， 然 后 再 对 投影 进行 联结 ， 又 可 以 
得 到 原来 的 关系 。 所 以 根据 8.9 节 的 论述 ， 这 个 关系 满足 如 下 的 联结 依赖 : 

(SSN, Name, PhoneN) p< (SSN, Name, Child) 

在 8.9 节 中 ， 我 们 讨论 过 如 果 一 个 关系 满足 非 平凡 的 联结 依赖 ， 则 它 可 能 含有 许多 宛 余 信 
息 (事实 上 ， 比 函数 依赖 引起 的 元 余 信息 多 )。 由 于 信息 元 余 是 引起 更 新 异常 的 一 个 原因 ， 
所 以 关系 设计 理论 要 求 我 们 把 原始 的 关系 分 解 为 如 下 的 3 个 关系 


| 


111-22-3333 Joe Public 
222-33-4444 Bob Public 


SSN PhoneN SSN Child 


111-22-3333 222-33-4444 
111-22-3333 333-44-5555 
222-33-4444 444-55-6666 
222-33-4444 555-66-7777 
























111-22-3333 516-345-6789 








111-22-3333 | 516-123-4567 
222-33-4444 | 212-987-6543 
222-33-4444 | 212-135-7924 






尽管 这 样 进行 分 解 确实 去 除了 更 新 异常 ， 但 还 存在 其 他 一 些 困难 。 考 虑 查询 找到 Joe 的 所 
有 和 孙子 的 电话 号 码 。 下 面 的 SQL 语句 : 


SELECT G.PhoneN 

FROM PERSON P, PERSON C, PERSON G 

WHERE P.Name = 'Joe Public’ AND (16.1) 
P.Child = C.SSN AND 
C.Child = G.SSN 


对 原始 模式 进行 查询 ， 而 如 下 语句 


SELECT .N.PhoneN 

FROM CHILDOF C, CHILDOF G, 
PERSON P, PHONE N 

WHERE P.Name = 'Joe Public' AND ， (16.2) 
P.SSN = C.SSN AND À 
C.Child = G.SSN AND 
G.SSN = N.SSN 


对 于 分 解 后 的 模式 进行 同样 的 查询 。 这 两 个 SQL 表达 式 在 实现 我 们 刚才 给 出 的 查询 时 显得 比 
较 麻烦 。 

问题 在 于 PERsON 的 原始 关系 模式 中 的 元 余 只 是 因为 关系 数据 模型 不 能 以 一 种 自然 的 方法 
处 理 集合 - 值 属性 。 对 于 原始 表 来 说 ， 更 合适 的 模式 是 
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PERSON (SSN: String, Name: String, 
PhoneN: {String}, Child: {String}) 


其 中 ， 插 号 {} 代 表 和 集合 - 值 属性 。 例 如 ，Child:{String} 表 示 一 个 元 组 中 的 属性 Child 的 值 是 
String 类 型 的 元 素 集 合 。 这 样 的 表 中 的 行 具 有 如 下 的 形式 (注意 其 中 的 集合 ~- 值 元 素 ): 

(111-22-3333, Joe Public, 

{516-123-4567, 516-345-6789}, {222-33-4444, 333-44-5555}) 

(222-33-4444, Bob Public, 

{212-987-1111, 212-987-6543}, {444-55-6666, 555-66-7777}) 

关于 上 述 例子 的 第 二 个 问题 是 SQL 处 理 查 询 16.1 和 16.2 显 得 比较 第 拙 。 假 设 属性 Child 的 类 
型 是 {PERSON} 而 不 是 {String}， 并 且 SQL 可 以 处 理 作为 PERSON 元 组 集合 (而 不 仅仅 是 表示 
SSN 的 字符 串 集 合 ) 的 属性 Child 的 值 。 这 样 就 可 以 使 查询 更 简明 和 自然 ， 因 为 表达 式 
P.Child.Child 可 以 被 赋予 精确 的 含意 : 由 所 有 对 应 于 P 的 孩子 的 孩子 的 元 组 组 成 的 集合 。 这 就 
使 得 我 们 可 以 用 如 下 所 示 的 简洁 方法 写 出 上 述 查 询 : 

SELECT P.Child.Child.PhoneN 


FROM PERSON P (163) 
WHERE P.Name = ‘Joe Public' 


PChild.Child.PhoneN 形 式 的 表达 式 称 为 路 径 表 达 式 (path expression), 

2.1sA 层次 结构 。 

假设 数据 库 中 的 一 些 (而 不 是 所 有 的 ) 人 是 学 生 。 因 为 学 生 也 是 人 ， 我 们 想 提 炼 出 所 有 
人 共同 具有 的 一 般 性 信息 ， 并 且 使 SrupaNT 的 模式 只 包含 学 生 的 特定 信息 : 


STUDENT(SSN: String, Major: String) 


则 可 以 推论 ， 因 为 SrupENT 也 是 PERSON， 所 以 每 个 学 生 都 有 一 个 Name 属 性 。 例 如 ， 查询 找 出 
计算 机 科学 系 的 所 有 学 生 可 以 写成 如 下 形式 : 


SELECT S.Name 
FROM STUDENT S 
WHERE S.Major = 'CS' 


在 SLQ-92 中 ， 上 述 查 询 将 被 拒绝 ， 因 为 属性 Name 没 有 明确 地 包含 在 STUDENT 的 模式 中 。 
但 是 ， 如 果 系 统 知道 学 生 与 人 之 间 的 1sA 联 系 ， 它 可 以 推断 STUDENT 从 PERSON 继 承 了 Name 
属性 。 

从 实体 -联系 模型 中 ， 我 们 对 IsA 层 次 结构 的 概念 已 经 非常 熟悉 。 但 是 ，E-R 模 型 并 不 能 用 
于 查询 语言 。 所 以 我 们 不 得 不 使 用 关系 模型 和 标准 的 SQL， 写 出 如 下 的 更 复杂 的 查询 : 


SELECT P.Name 
FROM PERSON P, STUDENT S 
WHERE P.SSN = S.SSN AND S.Major = 'CS' 


从 本 质 上 说 ，SQL-92 程 序 员 必须 使 每 一 个 查询 都 包含 一 个 IsA 联 系 的 实现 。 

3.blob 

blob 代 表 二 进 制 大 对 象 (binary large object)。 实 质 上 ， 所 有 关系 DBMS 都 允许 关系 具有 
blob 类 型 的 属性 。 例 如 ， 一 个 电影 数据 数据 库 可 能 拥有 如 下 的 模式 : 


Movie (Name: String, Director: PERSON, Video: blob) (16.4) 
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Rte Videos AERA, E T UMS ILS HORE. RRRA, W 
流 是 一 个 巨大 的 、 无 结构 的 位 序列 。 
blob 存 在 一 些 问题 。 考 虑 查询 : 


SELECT M.Director 
FROM MoviE M 
WHERE M.Name = 'The Simpsons' 


为 了 计算 WHERE 子 句 ， 一 些 系统 可 能 会 把 包含 blob 的 所 有 元 组 都 从 磁盘 上 取出 放 和 人 内 存 中 。 
这 会 产生 巨大 的 开销 。 即 使 数据 库 在 处 理 blob 方 面 得 到 优化 ， 它 的 可 选择 余地 仍然 有 限 。 假 
设 我 们 只 需要 从 20 000 ~ 50 000 帧 的 数据 。 如 果 仍 使 用 传统 的 关系 模型 , 将 无 法 得 到 这 些 信息 。 
为 了 处 理 这 样 的 查询 ， 我 们 需要 一 个 专门 的 例 程 frameRange(from ，to)， 它 可 以 实现 为 存储 过 
程 ， 这 样 对 于 特定 的 视频 blob 返 回 指定 范围 内 的 帧 。 | 

把 frameRange() 作 为 一 个 操作 符 加 入 关系 数据 模型 有 意义 吗 ? 这 种 添加 可 能 会 使 任何 人 都 
可 以 使 用 视频 blob ， 但 是 它 对 于 那些 存储 DNA 序 列 和 VLSI 芯片 设计 的 blob 毫 无 帮助 。 所 以 ， 
与 其 用 这 些 专门 的 操作 来 束缚 数据 模型 ， 不 如 提供 一 种 机 制 使 得 用 户 可 以 为 每 一 类 blob 单 独 
定义 操作 。 

4. x BR 

刚才 讨论 的 SQL 的 缺点 使 人 们 产生 了 开发 存储 和 检索 对 象 的 数据 库 的 想法 。 如 附录 中 所 
作 的 解释 ， 对 象 包含 一 组 属性 和 可 以 存 取 那 些 属性 的 一 组 方法 ， 以 及 相关 的 继承 层次 结构 。 

属性 值 可 以 是 复合 数据 类 型 或 其 他 对 象 的 实例 。 例 如 ， 对 象 person 可 能 包含 一 个 表示 他 的 
地 址 的 属性 和 表示 他 的 配偶 的 属性 。 l 

因为 属性 的 值 可 能 是 对 象 的 实例 ， 为 对 象 定 义 的 操作 可 以 用 在 查询 中 。 所 以 ， 视 频 对 象 
可 能 有 一 个 方法 frameRange() 用 于 查询 中 。 


SELECT M.frameRange(20000,50000) 
FROM Movie M . 
WHERE M.Name = 'The Simpsons' 


5. 数据 库 语 言 中 的 阻抗 不 匹配 

不 太 可 能 完全 用 SQL 编写 一 个 完整 的 应 用 程序 ， 所 以 典型 的 数据 库 应 用 程序 都 是 用 宿主 
语言 (如 C 或 Java) 编写 的 ， 并 且 通 过 执行 嵌入 宿主 程序 的 SQL 查询 来 访问 数据 库 。 第 10 章 讨 
论 了 从 宿主 语言 访问 数据 库 的 一 些 机 制 e 。 

这 个 方法 的 问题 在 于 ，SQL 面 向 的 是 集合 ， 意 味 着 它 的 查询 返回 的 是 元 组 集合 。 相 反 ，C、 
Java 以 及 其 他 宿主 语言 不 理解 关系 并 且 不 支持 关系 上 的 高 层次 的 操作 。 除 了 类 型 不 匹配 之 外 ， 
SQL 的 声明 性 (指明 作 什么 ) 与 宿主 语言 的 过 程 性 (程序 员 必 须 说 明 怎 么 作 ) 存在 明显 的 不 
同 。 这 种 现象 加 重 了 数据 访问 语言 和 宿主 语言 之 间 的 阻抗 不 匹配 (impedance mismatch)， 所 
以 人 们 发 明了 游标 机 制作 为 过 程 性 宿主 语言 和 SQL 的 适配器 。 

早期 开发 对 象 数据 库 的 一 个 原因 就 是 它 有 可 能 消除 阻抗 不 匹配 。 其 基本 思想 比较 简单 : 
选择 一 种 典型 的 面向 对 象 语 言 (C++ 和 Smalltalk 是 当时 主要 的 候选 对 象 ; 20 世纪 90 年 代 增 加 


O ”存储 程序 使 用 的 语言 (SQL/PSM， 见 第 10 章 ) 在 计算 上 是 完整 的 ， 但 是 很 难说 它 是 C、C++ 或 Java 语 言 的 
合适 的 替代 者 。 
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了 Java) 作为 数据 操纵 语言 。 因 为 对 象 语言 和 对 象 数据 库 的 基础 都 是 对 象 ， 所 以 不 会 出 现 阻 
抗 不 匹配 的 问题 。 

当时 ， 这 种 想法 似乎 是 非常 吸引 人 的 ， 但 是 其 中 也 存在 -一些 问题 。 首 先 ， 仍 然 需 要 一 种 
强大 的 、 声 明 性 的 查询 语言 (如 SQL) 来 支持 复杂 的 数据 查询 。 由 于 C++ 和 Java 并 不 能 容易 地 
扩展 为 声明 性 的 查询 语言 ， 因 此 阻抗 不 匹配 仍然 存在 9 。 

另 一 个 困难 是 ， 不 再 只 有 一 种 数据 操作 语言 ，SQL (尽管 与 宿主 语言 不 匹配 ) ， 我 们 现在 
具有 和 宿主 语言 一 样 多 的 数据 操作 语言 。 这 本 身 并 没什么 坏处 ， 因 为 这 些 宿主 语言 中 没有 任 
何 一 个 是 新 的 并 且 多 数 程序 员 都 比较 熟悉 这 些 语言 。 问 题 是 不 同 的 对 象 语言 具有 稍 有 不 同 的 
对 象 模型 。 所 以 ， 难 于 定义 一 个 ， 统 一 数据 模型 。 例 如 ， 如 果 一 个 对 象 由 使 用 某 种 宿主 语言 
的 应 用 程序 所 产生 ， 那 么 使 用 由 另 一 种 宿主 语言 编写 的 应 用 程序 进行 访问 就 可 能 出 现 问题 。 

本 章 讨论 的 两 个 主要 的 对 象 数据 库 标准 (SQL:1999 和 ODMG) 对 于 阻抗 不 匹配 问题 的 影 
响 具 有 不 同 的 观点 。 其 中 一 部 分 原因 是 上 述 困难 ， 另 一 部 分 原因 是 设计 理念 的 不 同 ， 
SQL:1999 并 不 以 消除 阻抗 不 匹配 为 目标 。 相 反 ，ODMG 把 消除 阻抗 不 匹 配 视 为 主要 的 〈 即 使 
还 比较 难以 琢磨) 设计 目标 之 一 。 


对 象 数据 库 与 关系 数据 库 


前 面 的 例子 概括 了 对 象 模型 及 其 与 关系 模型 的 关系 。 

.* 关系 数据 库 包 含 关 系 ， 即 元 组 的 集合 ， 而 对 象 数 据 库 包 含 类 ， 即 对 象 的 集合 。 所 以 ， 关 
系数 据 库 可 能 有 一 个 称 为 PERSON 的 关系 ， 拥 有 包含 每 一 个 人 的 信息 的 元 组 ， 而 对 象 数据 
库 可 能 有 一 个 称 为 PERSON 的 类 ， 拥 有 包含 每 一 个 人 的 信息 的 对 象 。 通 过 为 每 一 个 关系 定 
义 一 个 类 ， 特 定 的 关系 数据 库 可 以 在 对 象 模型 中 实现 。 特 定 类 的 属性 为 对 应 的 关系 的 属 
性 ， 每 一 个 经 过 类 的 实例 化 得 到 的 对 象 对 应 一 个 元 组 。 

“ 在 关系 数据 库 中 ， 元 组 的 组 成 部 分 必须 是 基本 类 型 (FAE, ERE); 在 对 象 数据 库 
中 ， 对 象 的 组 成 部 分 可 以 是 复杂 类 型 (集合 、 元 组 、 对 象 等 )。 

* 对 象 数 据 库 具有 一 些 关 系数 据 库 不 具备 的 性 质 : 

“ 对象 可 以 组 成 继承 层次 结构 ， 即 允许 低 类 型 的 对 象 从 高 类 型 的 对 象 继承 属性 和 方法 。 
这 有 助 于 减少 类 型 规格 说 明 中 的 混乱 并 且 产 生 更 简洁 的 查询 。 
* 对象 可 以 有 方法 ， 并 且 可 以 从 查询 中 调用 这 些 方法 。 例 如 ， 前 面 提 到 的 关于 MOVIE 
类 的 规格 说 明 可 能 包含 一 个 方法 frameRange， 并 具有 如 下 的 形式 的 声明 : 
list (VIDEOFRAME) frameRange (Integer , Integer); 
其 中 指出 frameRange 具 有 两 个 整数 类 型 参数 并 且 返 回 视频 帧 的 列表 。 这 样 的 声明 通 
过 专门 的 对 象 定义 语言 实现 ， 该 语言 与 SQL 的 数据 定义 子 语言 非常 类 似 。 

“方法 的 实现 可 以 使 用 标准 的 宿主 语言 (如 C++ 或 Java) 预先 进行 编写 ， 并 存储 在 服务 器 
上 。 在 这 一 点 上 ,方法 类 似 于 SQL 数 据 库 中 的 存储 过 程 ( 见 10.2.5 节 )。 但 是 ， 存 储 过 程 
与 任何 特定 的 关系 无 关 ， 而 存储 的 方法 是 相应 类 中 的 一 个 部 分 并 且 可 以 沿 着 对 象 类 型 层 


O 在 这 里 ,我们 应 该 提 及 正在 进行 的 关于 Java 数 据 对 象 规格 说 明 (Java Data Objects Specification) 的 工作 ， 
它 的 目标 是 开发 一 种 能 更 好 地 混合 到 Java 语 靶 中 的 查询 语言 。 
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结构 被 继承 ， 就 像 面 向 对 象 程序 设计 语言 中 的 方法 一 样 。 
SNARE 数据 操纵 语言 和 宿主 语言 为 同一 语言 。 


16.2 发 展 历史 


下 面 的 历史 回顾 可 以 帮助 我 们 更 好 地 理解 对 象 数据 库 的 演化 发 展 。 

1. 20 世 纪 80 年 代 早 期 : 性 套 关系 (也 称 为 非 1NEF ) 

嵌 套 关系 的 思想 是 早期 为 解决 关系 数据 模型 的 一 些 限制 而 开发 的 方法 [Makinouchil977， 
Arisawa et al.1983, Roth and Korth 1987, Jaeschke and Schek 1982, Ozsoyoglu and Yuan 
1985]。 在 嵌 套 关系 中 ， 属 性 可 以 为 relation 类 型 。 所 以 ， 在 表 













111-22-3333 Joe Public 516-345-6789 


516-123-4567 


222-33-4444 Bob Public 
333-44-5555 Sally Public 














222-33-4444 Bob Public 212-987-6543 


212-987-1111 


444-55-6666 Maggy Public. 
585-66-7777 Mary Public 

















中 ， 每 一 个 元 组 有 四 个 组 成 部 分 。 和 传统 关系 模型 一 样 ， 前 两 个 组 成 部 分 是 原子 值 。 但 是 ， 
第 三 和 第 四 个 属性 的 值 不 是 原子 的 : 它们 分 别 是 一 元 和 二 元 关系 。 第 一 个 元 组 的 第 三 部 分 中 
的 一 元 关系 代表 Joe Public 的 电话 号 码 列表 ， 而 这 个 元 组 中 的 第 四 部 分 中 的 关系 描述 了 Joe 的 子 
k (通过 社会 保险 号 和 名 字 )。 

经 验 表 明 ， 骸 套 关 系 模型 具有 很 多 限制 ， 并 且 其 查询 语言 和 模式 设计 理论 十 分 复杂 。 

2. 20 世 纪 80 年 代 中 期 : 持久 对 象 

持久 对 象 的 想法 来 自 于 程序 设计 语言 并 且 可 以 追溯 到 20 世 纪 60 年 代 。 从 概念 上 说 ， 早期 
的 对 象 数据 库 系 统 就 是 持久 的 C++ 或 Smalltalk 。 

持久 对 象 的 基本 思想 简单 而 优雅 。 

“用 户 可 以 声明 一 些 C++ 或 Smalltalk 对 象 为 持久 对 象 。 

。 当 应 用 程序 在 程序 中 引用 持久 对 象 时 ， 系 统 检查 对 象 是 否 在 内 存 缓冲 区 内 。 如 果 不 在 ， 

产生 一 个 对 和 象 故障 (object fault) ， 系 统 把 对 象 放 和 人 内 存 中 ， 这 一 过 程 对 用 户 程序 来 说 

是 透明 的 。 

。 当 程序 执行 完毕 ， 如 果 更 新 了 持久 对 象 ， 则 对 象 的 新 版 本 将 以 对 用 户 透 明 的 方式 返回 到 

大 容量 存储 器 中 。 

具有 持久 对 象 的 程序 设计 语言 消除 了 数据 库 数据 类 型 和 宿主 语言 的 数据 关 型 间 的 阻抗 不 
匹配 的 问题 9 。 但 是 ， 它 们 不 提供 类 似 于 SQL 中 的 SELECT 语句 那样 的 高 层 声 明 性 查询 机 制 。 
其 结果 是 所 有 的 查询 都 必须 使 用 宿主 语言 中 可 用 的 结构 过 程 化 地 编程 。 我 们 将 在 16.4.5 节 看 到 
ODMG 标 准 用 某 种 程度 的 阻抗 不 匹配 换取 了 对 “豪华 ”的 声明 式 查询 语言 的 支持 。 


O 注意 ,持久 数据 类 型 仅 在 语言 具有 丰富 的 数据 类 型 时 才能 减少 阻抗 不 匹配 。 例 如 ， 使 C 的 数据 类 型 持久 化 
后 ， 由 于 它 缺 乏 集合 数据 类 型 ， 所 以 不 太 可 能 对 这 个 问题 有 所 帮助 。 
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3. 20 世 纪 90 年 代 早 期 : 对 象 -关系 数据 库 

对 象 - 关 系数 据 库 (object-relational database) 的 基本 思想 是 : 关系 仍然 是 元 组 的 集合 ， 
但 是 元 组 的 组 成 部 分 可 以 是 对 象 。 对 象 -关系 模型 在 两 个 早期 产品 UniSQL 和 Illustra 中 应 用 。 
对 象 -关系 数据 库 并 不 像 近 来 的 一 些 对 象 数 据 库 那 样 通用 。 在 近来 的 这 些 数 据 库 中 ， 任 意 对 象 
(不 仅 是 关系 ) 都 可 以 位 于 数据 模型 的 最 高 层 。 但 是 ， 它 们 在 接近 。 现 在 ， 多 数 关系 数据 库 产 
品 的 最 新 版 本 都 支持 对 象 -关系 特征 ， 并 且 SQL:1999 标 准 也 有 了 对 象 ~ 关 系 扩展 。16.5 节 将 对 
这 些 内 容 进行 介绍 。 

4.20 世 纪 90 年 代 中 期 : 对 象 DBMS 的 增殖 

一 些 早期 的 对 象 DBMS 系 统 ， 包 括 0，、、GemStone、ObjectStore、Poet、Versant 和 其 他 系 
统 使 得 这 个 领域 趋 于 成 熟 。 每 一 个 实现 都 对 基本 的 概念 框架 作出 了 贡献 。 

5. 20 世 纪 90 年 代 的 中 期 到 后 期 : 对 象 数据 管理 标准 

这 个 领域 发 展 到 了 一 个 新 的 阶段 ， 需 要 新 的 标准 来 推动 用 户 接受 新 的 模式 。 我 们 将 讨论 
其 中 三 个 标准 。 

ODMG 

ODMG 标 准 (由 对 象 数 据 库 管理 组 织 开 发 ) 涉及 对 象 数据 库 和 (作为 特例 ) 对 象 -关系 
数据 库 系统 。 它 的 数据 模型 支持 对 象 ， 关 系 是 简化 的 特殊 对 象 类 型 。 该 标准 有 如 下 几 个 主要 
部 分 : 

。ODL 一 一 对 象 定 义 语言 ， 如 何 指定 数据 库 模式 。 

。OQL 一 一 (和 SQL 类 似 ) 对 象 查 询 语言 。 

。 宿 主语 言 绑 定 一 一 如 何 从 过 程 化 的 语言 内 部 使 用 DODL 和 QOQL 。 标准 定义 了 C++、 

Smalltalk 和 Java 的 绑 定 。 在 ODMG 中 ， 宿 主语 言 也 作为 对 象 操纵 语言 。 

SQL:1999 

SQL 的 最 新 版 本 ，SQL:1999 支 持 对 象 - 关 系数 据 模型 的 一 个 子 集 。 顶 层 结 构 是 包含 了 元 组 
集合 的 关系 ， 但 是 元 组 的 组 成 部 分 可 以 是 对 象 。SQL:1999 标 准 与 ODMG 在 对 象 - 关 系数 据 库 
系统 上 有 部 分 重合 ,但 是 语法 却 有 极 大 不 同 。 另 外 ， 为 了 把 关系 模型 推广 到 对 象 -~ 关系 模型 ， 
SQL:1999 为 语言 添加 了 一 些 其 他 的 特性 ， 如 : 

。 增 强 SQL 数 据 定义 、 操 纵 和 查询 语言 (7.6 节 和 16.5 节 )。 

。 触 发 器 (FOB). 

。 在 10.2.5 节 讨论 的 SQL 持久 存储 模块 (SQL/PSM) 语言 ， 可 以 使 程序 员 编 写 存储 过 程 。 。 

。 调 用 级 接口 (SQL/CLI) 的 定义 ， 类 似 于 ODBC (10.6 节 )。 

。 多 媒体 扩充 。 

CORBA ， : 

在 对 象 数 据 库 的 演化 过 程 中 ， 人 们 把 相当 大 的 努力 投入 到 了 客户 /服务 器 系统 的 标准 的 开 
发 上 ， 在 这 种 系统 中 客户 可 以 访问 服务 器 上 的 对 象 。 对 象 管理 组 (OMG ) 。 提 出 了 这 样 一 个 
标准 ， 即 CORBA ， 表 示 公 共 对 象 请 求 代理 体系 结构 。 这 个 标准 的 最 近 的 版 本 允许 客户 以 事务 


O “定义 存储 过 程 的 能 力 十 分 重要 ， 所 以 SQL/PSM 重 新 包含 在 了 SLQ-92 标 准 中 。 
日 ”对 象 管理 组 织 OMG 和 对 象 数据 库 管 理 组 织 ODMG 是 不 同 的 机 构 。 
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的 方式 访问 位 于 远程 服务 器 上 的 持久 对 象 ， 并 且 使 用 声明 性 的 查询 语言 执行 这 些 访问 。 所 以 ， 
CORBA 可 以 提供 对 象 数据 库 管理 系统 的 功能 。16.6 节 将 对 CORBA 做 进一步 的 讨论 。 


16.3 概念 上 的 对 象 数据 模型 


为 了 避免 迷失 在 ODMG 和 SQL:1999 标 准 的 细节 中 ， 我 们 首先 介绍 适合 对 象 数据 库 的 数据 
模型 的 概念 上 的 观点 。 概 念 对 象 数据 模型 (Conceptual Object Data Model) (CODM) A FO, 
的 研究 小 组 的 工作 [Bancilhon et al. 1990]，0, 对 象 DBMS 对 ODMG 标 准 产 生 了 非常 大 的 影响 。 
事实 上 ，CODM 接 近 于 ODMG 。 但 是 ， 它 不 受 一 些 实际 细节 以 及 为 了 兼容 现 有 产品 和 标准 而 
进行 的 低层 实现 的 束缚 。 另 外 ，SQL:1999 的 对 象 -关系 扩展 可 以 用 CODM 方 便 地 进行 解释 ， 
这 使 得 两 个 标准 间 的 关系 更 易 理 解 。 

在 CODM 中 ， 每 一 个 对 象 都 有 唯一 不 可 更 改 的 标识 ， 称 为 对 象 ld (oid)， 它 独立 于 对 象 的 
实际 值 。oid 在 创建 对 象 时 由 系统 赋予 并 且 在 对 象 的 整个 生命 周期 中 都 不 改变 。 注 意 ，oid 与 关 
系 中 的 主键 不 同 。 同 oid 一 样 ， 主 键 唯一 确定 对 象 。 但 是 与 oid 不 同 的 是 ， 主 键 的 值 可 以 改变 
(一 个 人 可 能 会 改变 他 的 社会 保险 号 码 )。 另 外 ，oid 是 一 个 内 部 对 象 名 ， 正 常情 形 下 对 程序 员 
不 可 见 〈 在 一 些 语 言 中 甚至 不 能 通过 属性 访问 )。 如 果 需 要 反复 引用 一 个 对 象 ， 那 么 在 对 象 被 
创建 和 检索 后 需要 把 oid 存 储 在 一 个 变量 中 。 而 另 一 方面 ， 主 键 是 可 见 的 ， 并 且 为 了 检索 一 个 
特定 的 对 象 可 以 在 查询 中 显 式 地 提 及 主键 。 


16.3.1 对 象 和 值 
下 面 是 一 个 描述 ，Joe Public 的 对 象 的 例子 : 


(#32, [ SSN: 111-22-3333, 
Name: Joe Public, (165) 
PhoneN: {"516-123-4567", "516~345-6789"}, 7 
Child: {#445, #73}] ) 


符号 #32 就 是 数据 对 象 的 oid， 它 代表 真实 世界 中 的 Joe Public。 余 下 的 部 分 说 明了 对 象 的 值 。 
oid 在 其 他 对 象 中 确定 了 这 个 对 象 ， 值 提供 了 关于 Joe 的 实际 信息 。 注 意 ，Child 属 性 的 值 是 一 
组 PERSON 对 象 的 oid， 这 些 PERSON 对 象 描述 了 Joe 的 两 个 孩子 。 
形式 上 ， 一 个 对 象 (object) 具有 二 元 组 的 形式 (oid,val)， 其 中 oid 代 表 对 象 H，val 代 表 值 。 
值 (value) 部 分 val 可 以 拥有 如 下 形式 : 
* 基 本 值 (primitive value) 如 整数 型 、 字 符 串 型 、 浮 点 型 或 布尔 型 的 数据 ， 例 如 : 
“516-123-4567”, 
。 引 用 值 一 一 对 象 的 oid。 例 如 ，#445。 
* 元 组 值 一 一 为 [AL:v1,…,AwniVs] 形 式 ， KPA, AZAR BES, 并 且 v1,…,v; 为 相应 
的 值 。 例 如 ,在 (16.5) 的 对 象 #32 中 的 全 部 值 部 分 (括号 内 的 )。 
。 集 合 值 一 一 为 {Vi,V2… VBR, Kev vA. Blan: {"516-123-4567", "516- 
3456-6789"}。 
为 了 区 别 于 基本 类 型 ， 引 用 值 、 元 组 值 以 及 集合 值 称 为 复杂 值 (complex value )。 实 际 的 
ODMG 数 据 模型 包含 额外 的 复杂 值 类 型 ， 如 包 (同一 元 素 可 以 具有 多 个 副本 的 集合 )、 列 表 、 
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结构 、 枚 举 类 型 和 数组 。 但 是 ， 在 此 不 考虑 这 些 类 型 ， 因 为 它们 没有 为 整个 概念 框架 添加 新 
的 内 容 。 

注意 ， 对 象 的 oid 部 分 是 不 能 改变 的 〈 如 果 改 变 ， 就 可 能 表示 不 同 的 对 象 ) 。 相 反 ， 对 象 
的 值 作为 更 新 的 结果 可 以 被 其 他 值 替换 。 例 如 ， 如 果 要 变更 Joe Public 的 电话 号 码 ， 将 PoneN 
属性 的 值 用 一 个 新 值 奉 换 ， 但 是 对 象 仍 保持 同样 的 oid 并 被 认为 是 同一 个 对 象 。 


16.3.2 类 


在 面向 对 象 系统 中 ， 语 义 相似 的 对 象 组 织 成 为 类 (class)。 例 如 ， 所 有 代表 人 的 对 象 组 成 
了 PERSON 类 。 

类 在 CODM 中 扮演 的 角色 与 关系 在 关系 数据 库 中 扮演 的 角色 一 样 。 但 是 ， 在 SLQ-92 中 ， 
数据 库 是 一 组 关系 ， 每 个 关系 又 是 一 组 元 组 。 在 CODM 中 ， 数 据 库 是 一 组 类 ， 每 一 个 类 是 一 
组 对 象 。 所 以 ， 在 SQL-92 中 ， 我 们 可 以 有 称 为 PERsoN 的 关系 ， 其 元 组 包含 了 一 个 人 的 信息 ， 
在 CODM 中 可 以 有 一 个 称 为 PERSON 的 类 ， 其 对 象 含 有 每 一 个 人 的 信息 。 

所 以 ， 类 是 一 种 把 对 象 组 成 不 同类 别 的 方法 。 类 具有 类 型 (type) 以 及 方法 签名 
(method signature ) ， 类 型 描述 类 中 所 有 对 象 的 公共 结构 ， 方 法 签名 是 可 以 用 于 类 对 象 的 操作 
的 声明 。 稍 后 将 更 详细 地 讨论 这 些 概念 。 这 里 注意 ， 只 有 方法 签名 是 CODM 的 一 部 分 ， 方 法 
的 实现 并 不 是 CODM 的 一 部 分 。 方 法 的 实现 是 一 个 存储 在 数据 库 服务 器 上 的 由 宿主 语言 编写 
的 过 程 。ODBMS 必 须 提供 一 种 无 论 何 时 在 程序 中 使 用 该 方法 时 ， 都 可 以 调用 到 适当 的 实现 的 
HLHS 。 

在 关系 数据 模型 中 ， 两 个 表 可 以 通过 关系 间 约 束 (如 外 键 约束 ) 建立 关联 。 在 对 象 数据 
模型 中 ， 有 一 种 联系 扮演 着 特殊 的 角色 。 假 设 除了 把 所 有 代表 人 的 对 象 组 织 在 一 起 的 PERSON 
类 外 ， 我 们 还 有 STupENT 类 ， 它 把 所 有 表示 学 生 的 对 象 组 织 在 一 起 。 自 然 地 ， 每 一 个 学 生 都 是 
人 人， 所 以 组 成 STUDENT 类 的 对 象 集合 必须 是 组 成 PERsoN 类 的 对 象 集合 的 子 集 。 这 是 子 类 联系 
(subclass relationship) 的 一 个 例子 ， 其 中 STUpENT 是 PERsoN 的 子 类 。 子 类 联系 也 称 为 ISA 联 系 
或 继承 联系 (inheritance relationship Jo ` 

赋予 类 的 所 有 对 象 的 集合 称 为 类 的 外 延 (extent)。 为 了 充分 反映 我 们 关于 子 类 联系 的 直 
觉 ， 外 延 必须 满足 如 下 的 性 质 : 

如 果 C, 是 C? 的 子 类 ， 那 么 C: 的 外 延 包含 C 的 外 延 。 
例如 ， 因 为 SrupENT 是 PERSON 的 子 类 ， 所 有 学 生 的 集合 是 所 有 人 的 集合 的 子 集 。 

查询 语言 和 数据 操纵 语言 都 明白 子 娄 联系 。 例 如 ， 如 果 假 设 查询 返回 所 有 具有 某 些 性 质 
的 PERSON 对 象 ， 并 且 如 果 一 些 STUDENT 对 象 具 有 那些 性 质 ， 查 询 将 返回 查询 结果 中 的 STUDENT 
对 象 ， 因 为 每 一 学 生 都 是 人 。 

综 上 所 述 , 类 具有 类 型 ,类 型 描述 了 类 的 结构 , 方法 签名 (经 常 被 认为 是 类 型 的 一 部 分 )， 
外 延 ， 列 出 属于 类 的 所 有 对 象 。 这 样 ， 类 、 类 型 ， 以 及 外 延 就 构成 了 彼此 相关 而 又 不 同 的 
概念 。 


O ”通常 这样 的 代码 在 服务 器 端 执行 。 但 是 ， 用 Java 实 现 的 方法 可 能 在 客户 端 执行 ， 因 为 Java 提 供 了 在 机 器 
间 传 送 代码 的 机 制 。 
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16.3.3 类 型 


任何 数据 模型 的 一 个 重要 需求 是 数据 必须 适当 地 结构 化 。 由 于 基本 数据 结构 简单 ， 所 以 
在 关系 模型 中 完成 类 型 化 并 不 是 一 个 大 问题 。 在 对 象 数据 库 中 情况 比较 复杂 。 例 如 可 以 考虑 
(16.5) 中 的 对 象 。 可 以 说 它 的 类 型 ( 称 为 PERSON) 由 下 面 的 表达 式 表示 : 

[SSN: String, Name: String, PhoneN: {String}, Child: {PERSON}] (16.6) 
这 个 类 型 定义 指出 属性 SSN 和 Name 从 基本 域 String 中 取 值 ; 属性 PhoneN 的 值 必须 是 串 的 集 
合 ; 属性 Child 的 值 是 PERSON 对 象 的 集合 。 

简单 地 说 ， 对 象 的 类 型 是 对 象 组 成 部 分 的 类 型 的 集合 。 更 准确 地 说 ， 适 合 于 结构 化 对 象 
的 复杂 类 型 可 以 定义 如 下 : 

。 基 本 类 型 。 字 符 串 型 ， 浮 点 型 ， 整 数 型 等 。 

。 引 用 类 型 。 用 户 定 义 的 类 名 ， 如 PERsoN 和 STUDENT。 

。 元 组 类 型 。[A1:T},…,As:T,] 形 式 的 表达 式 ， 其 中 ，Aj 是 互 不 相同 的 属性 名 ，Ti 是 类 型 。 

(例如 ， 在 16.6 中 给 出 的 类 型 。) 

。 集 合 类 型 。{T} 形 式 的 表达 式 ， 其 中 T 是 类 型 。 例 如 {String}。 
注意 ，16.6 描 述 了 一 种 类 型 ， 其 中 一 个 关系 嵌 套 在 另 一 个 关系 中 。Child 的 每 一 个 值 都 是 一 个 
关系 : 一 组 PERsSON 类 型 的 元 组 。 另 一 方面 ， 字 符 串 为 基本 类 型 ， 所 以 PhoneN 的 值 是 一 组 基本 
类 型 值 。 

一 个 对 象 符合 某 一 类 型 是 什么 意思 呢 ? 由 于 对 象 的 递归 结构 以 及 IsA 层 次 结构 ， 使 这 个 问 
题 的 答案 不 太 简单 。 我 们 将 在 下 面 的 段落 中 逐步 介绍 类 型 的 概念 。 

1. 子 类 型 

除了 结构 化 地 组 织 对 象 之 外 ， 类 型 系统 可 以 确定 与 其 他 类 型 相 比 ， 哪 一 种 类 型 更 “结构 
化 ”。 例 如 ， 假 设 PERSON 对 象 的 类 型 是 


[SSN: String, Name: String, Address: [StNumber: Integer, 
StName: String]] 


这 是 一 个 元 组 类 型 ， 其 中 前 两 个 组 成 部 分 具有 基本 类 型 ， 第 三 个 组 成 部 分 为 元 组 类 型 。 

现在 考虑 STUDENT 类 型 的 对 象 。 显 然 ， 学 生 具 有 姓名 、 地 址 ， 以 及 PERSON 对 象 所 具有 的 其 
他 所 有 内 容 。 但 是 ， 学 生还 有 其 他 的 属性 ， 所 以 一 个 适当 的 类 型 可 能 是 

[SSN: String, Name: String, l 


Address: [StNumber: Integer, StName: String], 
Majors: {String}, Enrolled: {Course}] 


直觉 提示 我 们 STUDENT 类 型 比 PERsoN 类 型 含有 更 多 的 结构 。 第 一 ， 它 具有 PERsoN 的 所 有 属性 。 
第 二 ， 这 些 属性 的 值 至 少 与 相应 的 PERSON 的 属性 有 同样 多 的 结构 。 第 三 ，STUDENT 具 有 
PERSON 中 没有 的 属性 。 这 种 直觉 导出 子 类 型 ( subtype ) 与 超 类 型 (supertype ) 的 概念 : 如 果 
TT' 并 且 如 下 的 条 件 之 一 成 立 ， 那 么 类 型 T 是 T' 的 子 类 型 ( 超 类 型 )。 
。T 和 T' 是 引用 类 型 ，T 是 T' 的 子 类 。 
© T=[At Ty An Tn, AT Am? Tm} ATA: T'e, AT 是 元 组 类 型 (注意 ， TAS 
T' 的 所 有 属性 ， 即 m >n)， 且 T; = TT; 或 Ti 为 Ti 的 子 类 型 (对 于 每 一 个 二 1,…,n)。 
。T={To} 和 T' = {To} 都 是 集合 类 型 ， 且 To 是 了 的 子 类 型 。 
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根据 这 个 定义 ，STUDENT 是 PERSON 的 子 类 型 ， 因 为 它 包 含 了 为 PERSON 定 义 的 所 有 结构 并 且 具 有 
自己 额外 的 属性 。 但 要 注意 ， 具 有 额外 的 属性 不 是 类 型 成 为 子 炎 型 所 必须 的 条 件 。 例 如 
(SSN: String, Name: String, 


Address: [StNumber: Integer, StName: String, (16.7) 
POBox: String] ] . 


也 是 PERSON 的 子 类 型 ， 尽 管 它 不 具备 超出 PERsoN 定 义 范围 的 属性 。16.7 中 的 Address 属 性 比 
PERSON 中 的 Address 属 性 具有 更 多 的 结构 。 

2. 类 型 的 域 

类 型 的 域 (domain) 决定 所 有 符合 该 类 型 的 对 象 。 直 观 地 说 ， 类 型 T 的 域 (用 domain(T) 
表示 ) 是 T 的 各 组 成 部 分 的 域 的 适当 组 合 。 更 准确 地 说 ， 

“基本 类 型 的 域 (如 整数 型 或 字符 串 型 ) 就 是 我 们 所 期 望 的 (分 别 是 所 有 整数 和 字符 串 的 

集合 )。 

“引用 类 型 T 的 域 是 IT 的 外 延 ， 即 类 T 中 的 所 有 对 象 的 Id 的 集合 。 例 如 ， 如 果 T 是 PERSON， 

它 的 域 是 所 有 PERSON 对 象 的 oid 集 合 。 

© TCH AE AY ARIAT) An TALIA: Wi,…, An: Was]|n>0 且 w; E domain (T,))}， 即 所 有 

元 组 值 的 集合 ， 这 些 元 组 值 的 组 成 部 分 符合 属性 相应 的 类 型 。 所 以 ，(16.6) 的 类 型 的 域 

是 (16.5) 形 式 的 所 有 值 的 集合 。 

。 集 合 类 型 的 域 {T} 是 

{f{wi Wi} [k>0 H. w; E domain (T)} 

即 ， 它 包含 符合 给 定 类 型 T 的 值 的 集合 。 例 如 ， 类 型 {COURSE} 的 域 是 这 样 的 集合 ， 其 成 员 是 
COURSE 对 象 的 oid 的 有 限 集合 。 

容易 看 出 ， 域 是 以 如 下 的 方式 定义 的 ， 即 子 类 型 的 域 S (从 某 种 意义 上 说 ) 是 超 类 型 $' 的 
域 的 子 集 。 更 准确 地 说 ， 对 于 S 中 任何 特定 的 对 象 。， 或 者 o 已 经 在 S' 中 ， 或 则 可 以 通过 去 除 o 
中 包含 的 子 对 象 元 组 的 一 些 组 成 部 分 得 到 S' 中 的 对 象 0'。 例 如 ，PERSON 对 象 可 以 通过 去 除 
STUDENT 对 象 中 的 Major 和 Enrolled 属 性 得 到 。 类 似 地 ，PERsoN 对 象 可 以 通过 去 除 (16.7) 类 型 
的 对 象 中 所 含 的 嵌 套 地 址 的 POBox 组 成 部 分 而 获得 。 

3. 数据 库 模式 和 实例 

在 对 象 数据 库 中 ， 模 式 (schema) 包含 了 可 以 存储 在 数据 库 中 的 对 象 的 每 一 个 类 的 规格 
说 明 。 每 一 个 类 C 包 含 以 下 部 分 : 

。 与 C 相 关 的 类 型 。 该 类 型 决定 了 C 的 每 个 实例 的 结构 。 

。C 的 方法 签名 。 方 法 签名 (method signature) 指定 方法 的 名 字 、 类 型 和 方法 的 参数 的 顺 

序 ， 以 及 方法 产生 的 结果 的 类 型 。 例 如 ， 方 法 enrol0 具 有 下 面 的 签名 : 


Boolean enroll (STUDENT, COURSE); 

方法 enrolled(0) 具 有 签名 

{Course} enrolled (STUDENT); 

enroll() 的 签名 表示 要 登记 一 个 学 生 ， 必 须 提 供给 一 个 SrupENT 类 的 对 象 和 一 个 CouRsE 类 
的 对 象 。 该 方法 返回 一 个 布尔 值 来 指出 操作 的 结果 。enrolled0 的 签名 表示 ， 为 了 检查 学 
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生 的 登记 情况 ， 必 须 提供 一 个 STUDENT 对 象 ， 返 回 的 结果 是 一 组 学 生 登 记过 的 CoursE 的 

对 象 。 

。 subclass-of 联系 ， 确 定 C 的 超 类 。 

“完整 性 约束 ， 如 类 似 于 关系 数据 库 中 的 约束 的 键 约束 、 引 用 约束 ， 或 更 一 般 的 斯 言 ” 。 

数据 库 实 例 (instance) 包含 模式 中 指定 的 特定 类 的 对 象 。 对 象 必须 满足 模式 包含 的 所 有 
约束 ， 且 每 一 个 对 象 都 必须 具有 唯一 的 oid 。 

这 样 就 完成 了 概念 对 象 模型 的 定义 。 如 你 所 见 ，CODM 中 使 用 的 大 多 数 概念 都 是 从 我 们 
熟悉 的 关系 模型 扩充 而 来 ， 由 于 其 基础 的 数据 模型 十 分 丰富 ， 所 以 需要 小 心地 使 用 。 


16.3.4 对 象 -关系 数据 库 


对 象 - 关 系数 据 库 于 20 世 纪 90 年 代 初 期 出 现 ， 那 时 许多 厂商 开始 倡导 对 象 -关系 数据 库 系 
统 ， 认 为 它 是 从 关系 数据 库 迁 移 (到 对 象 数据 库 ) 的 一 条 比较 安全 的 途径 。 主 要 的 卖点 是 这 
些 数据 库 可 以 通过 扩展 已 经 存在 的 关系 数据 库 来 实现 。 经 长 时 间 的 考虑 ，SQL:1999 工 作 组 最 
终 采 用 了 对 象 - 关 系数 据 模型 的 一 个 有 限 子 集 , 该 子 集 对 应 于 CODM 的 一 个 子 集 。 一 般 情况 下 ， 
一 个 对 象 -关系 数据 库 包 括 : 

"一 个 关系 集合 (可 以 看 作 一 个 类 )。 

* 每 个 关系 包含 一 个 元 组 集 (可 以 看 作 表示 关系 的 类 的 实例 )。 

“每 一 条 元 组 的 形式 为 《oid，val)， 其 中 oid 代 表 对 象 ID ，val 代 表 元 组 值 ， 其 组 成 部 分 可 

以 是 任意 值 (例如 ， 基 本 值 、 元 组 集 、 对 其 他 对 象 的 引用 )。 
对 象 - 关 系 模型 和 CODM 模 型 的 主要 区 别 是 前 者 中 的 每 一 个 对 象 实例 的 顶层 结构 总 是 一 个 元 
组 ， 而 后 者 的 顶层 结构 可 以 是 任意 值 。 但 是 ， 对 象 -关系 DBMS 的 这 种 限制 并 没有 显著 削弱 它 
对 现实 世界 的 建 模 能 力 。 

对 象 -关系 模型 与 传统 关系 楼 型 的 区 别 在 于 关系 模型 中 的 元 组 组 成 部分 必须 是 基本 信 ， 而 
对 象 -关系 模型 中 的 元 组 组 成 部 分 则 可 以 是 任意 值 。 所 以 ， 关 系 模型 可 以 视 为 对 象 -关系 模型 
的 一 个 子 集 (所 以 也 是 CODM 的 一 个 子 集 )。 

16.5 节 将 讨论 SQL:1999 支 持 的 对 象 - 关 系 模型 的 子 集 。 


16.4 ODMG 标 准 


本 节 给 出 ODMG 标 准 的 各 个 方面 的 一 个 概述 。 关 于 ODMG3.0 的 权威 性 的 指南 可 参阅 
[Cattell and Barry 2000] 。 我 们 将 讨论 如 下 内 容 : 

。 数据 模型 ”什么 样 的 对 象 能 够 存储 在 ODMG 数 据 库 中 ? 

。 对 象 定义 语言 (ODL) 如 何在 数据 库 管理 系统 中 描述 这 些 对 象 ? 

。 对 象 查询 语言 (OQL) 如何 对 数据 库 进行 查询 ? 

。 事 务 机制 ”如何 指定 事务 的 边界 ? 

"语言 绑 定 ”如 何在 “现实 世界 ”中 使 用 ODMG 数 据 库 ? 


© ODMG 标 准 提供 指定 键 和 参照 完整 性 的 方法 ， 但 是 没有 定义 一 般 的 SQL 式 的 断言 的 语言 。SQL:1999 标 准 从 
SQL-92 继 承 了 约束 规格 说 明 语言 。 
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尽管 ODMG 的 基础 数据 模型 与 CODM 非 常 近似 ， 下 面 的 小 节 还 是 先 简 要 地 讨论 一 下 它们 
的 不 同 之 处 。 然 后 介绍 ODL， 即 ODMG 的 对 象 定义 语言 ， 它 是 一 种 描述 类 及 其 类 型 的 具体 语 
法 ， 接 着 讨论 ODMG 的 查询 语言 OQQL， 并 强调 它 与 16.1 节 中 讨论 的 查询 语言 的 不 同 之 处 。 

ODMG 数 据 库 体系 结构 

图 16-1 和 16-2 描 述 ODMG 数 据 库 的 总 体 体系 结构 。 同 关系 数据 库 一 样 ， 使 用 ODMG 数 据 
库 的 应 用 程序 用 如 C++ 这 样 的 宿主 语言 编写 。 为 了 访问 数据 库 ， 应 用 程序 必须 与 ODBMS 库 以 
及 实现 类 方法 的 代码 链接 。 在 对 象 数据 库 中 ， 大 多 数 操纵 对 象 的 代码 都 是 数据 库 自身 的 一 部 
分 : 每 个 类 都 有 适用 于 其 类 对 象 使 用 的 方法 集 。 这 些 方法 的 代码 存储 在 数据 库 服务 器 上 ; 方 
法 签名 则 通过 ODL 定 义 为 模式 的 一 部 分 。 当 一 个 方法 被 调用 时 , ODBMS 负 责 启用 适当 的 代码 。 
原则 上 ， 方 法 在 服务 器 端 或 客户 端 都 可 以 执行 。 但 是 ， 在 客户 端 执行 方法 需要 ODBMS 提 供 向 
客户 端 计算 机 运送 代码 的 机 制 。 由 于 实现 这 样 的 机 制 十 分 困难 ， 所 以 商用 DDOBMS 一 般 在 服务 
器 端 执行 方法 。 幸 运 的 是 ，Java 语 言 的 出 现 令 代 码 运送 变 得 非常 容易 ， 我 们 可 以 在 将 来 的 产 
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图 16-1” ODMG 应 用 结构 


在 服务 器 上 存储 代码 会 令 人 想起 关系 数据 库 中 的 存储 过 程 (参阅 10.2.5 节 )。 但 是 ， 一 者 
最 大 的 不 同 之 处 在 于 方法 的 实现 是 对 象 整体 的 组 成 部 分 ， 而 存储 过 程 是 为 了 性 能 和 安全 的 厌 
因 存 储 在 数据 库 中 的 外 部 应 用 程序 。 ` 

消除 数据 存 取 语言 和 宿主 语言 间 的 阻抗 不 匹配 是 ODMG 的 最 重要 的 设计 目标 之 一 。 这 个 
设计 目标 的 直接 现实 含义 是 宿主 语言 也 用 作 数 据 操 纵 语言 。 这 可 以 通过 语言 绑 定 (language 
binding) 来 实现 。 所 谓语 言 绑 定 是 一 组 标准 (每 种 宿主 语言 一 个 标准 )， 它 定义 了 C++ Java 
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和 Smalltalk 中 的 对 象 定义 如 何 映射 到 数据 库 对 象 。 这 种 映射 使 得 宿主 程序 通过 标准 的 宿主 语 
言语 句 〈 赋 值 、 增 加 等 ) 或 通过 执行 为 相应 类 定义 的 方法 来 直接 操纵 数据 库 对 象 。 一 旦 发 生 
了 这 种 交互 ，ODBMS 负 责 确保 事务 提交 后 的 结果 改变 是 持久 的 。 










用 宿主 语言 (C+. Java…… ) 
编写 的 类 方法 源 代码 





ODL 中 的 模式 规格 说 明 数据 库 
(BACH. Save) 规格 说 明 














ODBMS 软 件 oe j 
,方法 实现 的 目标 代码 


目标 代码 链接 器 


存 桩 在 服务 器 的 信息 






图 16-2 ODMG 数 据 库 体系 结构 


通常 ， 应 用 程序 用 OQL 查 询 来 寻找 对 象 或 对 象 集合 。 然 后 ， 应 用 程序 使 用 程序 设计 语言 
语句 和 对 象 的 方法 来 操纵 和 更 新 那些 对 象 。 此 时 不 需要 SQL 那样 专门 的 更 新 语句 ， 因 为 在 程 
序 中 对 任何 对 象 的 更 新 都 会 引起 数据 库 中 该 对 象 副本 的 更 新 。 例 如 ， 如 果 宿 主语 言 变量 Stud 
包含 持久 对 象 STUDENT 的 oid , 则 如 下 的 C++ 或 Java 指 令 


Stud.Name = "John"; 


将 使 得 数据 库 和 程序 中 学 生 的 姓名 都 更 改 为 “John”9 。 

注意 ， 这 种 数据 访问 的 方式 与 SQL 数据 库 中 使 用 的 数据 访问 方式 极为 不 同 。 在 SQL 数据 
库 中 ， 对 数据 的 任何 查询 和 修改 都 是 通过 SQL 这 种 与 典型 的 宿主 语言 极为 不 同 的 语言 来 完成 
的 。 即使 宿主 语言 是 面向 对 象 语言 ， 情况 也 是 这 样 ， 例 如 在 第 10 章 讨论 的 Java 语 言 使 用 JDBC 
和 SQLJ。 相 反 ， 在 ODMG 数 据 库 中 ， 数 据 直接 用 宿主 语言 进行 修改 ， 程 序 中 其 他 的 对 象 也 用 
同样 的 方式 进行 修改 。 

ODMG 提 供 专门 的 方法 允许 应 用 程序 向 数据 库 发 送 OQL 查 询 ( 即 SELECT 语 句 )。 这 种 设 
计 被 认为 是 整个 DODMG 方 案 中 的 “丑小鸭 " ， 因 为 它 产生 了 声名 狼藉 的 阻抗 不 匹配 问题 。 为 了 
解决 这 个 问题 ， 目 前 正在 努力 形成 中 的 Java 数 据 对 象 规格 说 明 (Java data object specification ) 
的 目标 是 开发 一 种 能 更 好 适应 Java 语 法 的 查询 语言 。 完 成 后 ， 这 个 规格 说 明 可 能 会 赫 代 现 有 


O 注意 ，ODMG 类 似 C++ 和 Java， 使 用 双 引 号 表示 字符 串 。 相 反 ， 在 SQL 中 用 单 引号 表示 字符 让 。 
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的 ODMG Java 绑 定语 言 。 

根据 上 述 讨论 可 知 ， 典 型 的 应 用 使 用 两 类 对 象 : 存储 在 数据 库 中 的 持久 (persistent) 对 
象 和 不 在 数据 库 中 存储 的 保持 应 用 逻辑 需要 的 辅助 信息 的 瞬时 (transient) 对 象 。 例 如 ， 一 个 
向 还 未 付 学 费 的 学 生发 送 提醒 通知 的 邮件 合并 应 用 查询 数据 库 并 为 每 一 个 学 生 创 建 一 个 临时 
对 象 ， 其 中 包含 那些 必须 出 现在 提醒 通知 中 的 信息 (例如 ， 姓名、 地址 、 学 费 、 最 后 期 限 )。 
这 些 对 象 只 在 应 用 程序 活动 时 有 用 ， 而 且 不 需要 保存 。 另 一 方面 ，STUDENT 对 象 可 能 需要 更 新 
和 保存 以 反映 学 费 通 知已 经 发 送 的 事实 。 定 义 对 象 持久 性 的 严格 的 语法 是 语言 绑 定 规格 说 明 
的 一 部 分 ，16.4.5 节 将 予以 讨论 。 


16.4.1 ODL: ODMG 对 象 定义 语言 


ODMG 对 象 定义 语言 (ODL) 与 SQL 中 的 数据 定义 子 语言 类 似 。 用 来 描述 对 象 数据 库 中 
的 模式 。 和 SQL 一 样 ， 用 ODL 定 义 的 模式 信息 存储 在 系统 目录 中 并 在 系统 运行 时 使 用 ， 以 评 
价 查询 并 执行 数据 库 更 新 。 

1. ODL 与 阻抗 不 匹配 

在 SQL 中 ， 数 据 定义 语言 (Data Definition Language) 的 作用 非常 清楚 ， 它 是 数据 库 中 描 
述 数据 的 唯一 方法 。ODMG 中 的 ODL 的 作用 不 太 清楚 。 语 言 绑 定 允 许 程序 员 直接 在 宿主 语言 
(例如 ，Java) 中 用 宿主 语言 的 语法 声明 数据 库 对 象 和 类 ， 所 以 此 时 就 不 再 需要 使 用 ODL 了 。 
这 与 嵌入 式 SQL、SQLJ、ODBC 或 JDBC 通 过 单独 的 语言 (SQL 的 DDL 子 集 ) 与 宿主 语言 结合 
采用 调用 层 或 语句 层 接口 来 定义 数据 库 模式 的 机 制 非常 不 同 。 更 加 复杂 的 是 ， 很 少 有 ODMG 
厂商 在 他 们 的 系统 中 真正 实现 了 ODL。 其 中 的 原因 在 这 里 不 作 讨论 。 

如 果 我 们 回想 起 完全 消除 阻抗 不 匹配 是 有 问题 的 ， 那 么 ODL 的 角色 就 变 得 更 清晰 了 。 在 
人 们 相信 C++ 是 唯一 可 信赖 的 编程 方法 的 时 代 ， 使 用 统一 语言 来 编写 应 用 程序 和 进行 数据 库 
访问 听 起 来 非常 吸引 人 。 对 象 将 在 宿主 语言 中 统一 声明 ， 与 其 是 否 为 用 来 存储 在 数据 库 中 的 
持久 对 象 或 是 在 应 用 结束 时 将 被 释放 的 空间 的 临时 对 象 无 关 。 然 而 ，Java 的 出 现 使 事情 变 得 
更 加 复杂 。 其 问题 在 于 Java 的 对 象 定义 方法 不 像 C++ 那样 详尽 。 即 使 在 Java 出 现 之 前 ， 
ODBMS 应 用 开发 团体 中 就 有 相当 多 的 Smalltalk (也 有 其 自身 的 限制 ) 的 拥护 者 。 所 以 问题 
是 : 所 有 这 些 使 用 不 同 对 象 定义 方式 的 语言 如 何 访问 同样 的 对 象 存储 ? Java 应 用 程序 能 操纵 
C++ 应 用 程序 生成 的 对 象 吗 ? ODMG 的 数据 模型 到 底 是 由 C++ 语言 绑 定 来 定义 的 还 是 由 Java 
绑 定 定义 的 ? 

SQL 数据 库 中 没有 上 述 问题 的 原因 在 于 它 有 一 个 与 所 有 宿主 语言 分 离 的 数据 定义 语言 。 
在 ODMG 中 ， 由 于 要 去 除 阻抗 不 匹配 ， 难 以 要 求 每 一 个 宿主 语言 都 有 同样 的 ODL。 然 而 ， 
ODL 作 为 指定 参照 数据 模型 的 方法 以 及 由 ODMG 定 义 的 三 种 语言 绑 定 的 目标 语言 还 是 有 用 的 。 
所 以 ， 虽然 ODL 不 能 作为 一 个 软件 包 ， 但 是 通过 提供 统一 的 概念 基础 ， 它 在 保持 ODMG 标 准 
的 统一 方面 起 着 重要 作用 。 特 别 是 ODMG 指 明 只 要 采用 属于 两 者 共同 拥有 的 ODL 的 子 集 进 行 
对 象 定义 ， 以 一 种 语言 编写 的 对 象 可 以 被 其 他 语言 编写 的 应 用 程序 访问 。 

2. ODL 和 ODMG 数 据 模型 

ODL 中 使 用 的 一 些 术语 在 某 些 方面 与 CODM 不 同 ， 下 面 着 重 讨论 它们 的 不 同 之 处 。 

ODL 描 述 每 个 对 象 类 型 的 属性 和 方法 ， 包 括 它 继承 的 属性 。 方 靶 由 它 的 签名 (signature) 
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确定 ， 签 名 包含 了 方法 名 、 名 称 、 序 号 、 参 数 的 类 型 、 返 回 值 的 类 型 ， 以 及 会 产生 的 异常 
(错误 和 特殊 条 件 )。 

ODL 是 CORBA 标 准 中 用 于 指定 对 象 的 接口 定义 语言 (Interface Definition Language, 
IDL) 的 扩展 。 在 Java 中 ，ODL 中 的 类 分 为 两 种 ， 第 一 种 叫做 接口 ， 第 二 种 叫做 类 。 为 了 避免 
与 CODM 类 混淆 ， 将 其 分 别称 为 ODMG 接 口 (ODMG interface) 和 ODMG 类 (ODMG class). 

按照 CODM，ODMG 接 口 和 类 定义 指定 以 下 方面 : 

“类 名 (在 CODM 意 义 下 ) 和 相关 的 继承 层次 结构 。 

。 类 的 相关 类 型 。 

这 些 定义 的 集合 指定 了 全 部 ODMG 数 据 库 模 式 。ODMG 接 口 和 ODMG 类 之 间 的 主要 区 别 
如 下 : 

e ODMG 接 口 不 能 包括 方法 的 代码 ; 只 允许 含有 方法 的 签名 (这 就 是 为 什么 称 其 为 接口 的 
原因 )。ODMG 包 含 类 方法 的 代码 。 方 法 的 签名 和 代码 既 可 以 使 用 宿主 语言 (如 C++ 或 
Java) 显 式 地 指定 ， 也 可 以 从 更 高 的 类 层次 结构 中 继承 过 来 。ODMG 接 口 也 不 指明 属性 ， 
而 ODMG 类 指明 属性 。 

。ODMG 接 口 不 能 有 它 自 己 的 对 象 成 员 ， 即 不 能 创建 接口 的 对 象 实例 。 相 反 ，ODMG 类 可 
以 (通常 有 ) 对 象 成 员 。 所 以 ，ODMG 接 口 的 外 延 包 含 属于 它 的 ODMG 子 类 的 对 象 。 

。ODMG 接 口 不 能 从 ODMG 类 继承 ， 只 能 从 其 他 ODMG 接 口 继承 。 

。ODMG 类 可 以 继承 多 个 ODMG 接 口 ， 但 最 多 只 能 有 一 个 直接 ODMG 超 类 。 

区 分 类 和 接口 的 原因 有 两 个 。 第 一 ， 可 以 使 ODL 成 为 CORBA 的 IDL 的 超 集 ， 因 此 提供 了 
与 分 布 式 系统 的 这 一 重要 标准 的 一 定 程度 的 兼容 性 。 第 二 ， 使 DODL 避 开 了 一 些 由 多 继承 引起 
的 问题 ， 例 如 ， 当 一 个 类 从 不 同 的 超 类 继承 了 同一 方法 的 不 同 的 定义 时 就 会 出 现 多 继承 。 

与 CODM 类 似 ，ODMG 区 分 对 象 与 值 。 在 ODMG 的 术语 中 ， 值 称 为 文字 (literal). WR 
如 前 所 述 用 二 元 组 (oid，val) 表示 。 另 一 方面 ,文字 可 以 有 复杂 的 内 部 状态 ,但 是 它们 没有 
oid， 以 及 任何 相关 方法 。 在 ODL 中 ， 对 象 创建 为 ODMG 类 的 实例 ， 而 文字 是 由 用 struct 关键 
字 指 定 的 类 型 的 实例 。 

类 Person 的 定义 如 下 : 

// An interface. 

// Note: Object is the top interface in ODMG, but a class in Java. 

interface PERSONINTERFACE: Object 
{ | String Name(); 


String SSN(); 
enum SexType {m,f} Sex(); 


} 
// An ODMG class 
// PERSON inherits from PERSONINTERFACE, but has no ODMG 
// superclass 
class PERSON: PERSONINTERFACE 
( extent PERSONEXT 
keys ( SSN, (Name, PhoneN) ): PERSISTENT; ) 
// properties of the instances of the type 
{ attribute ADDRESS Address; 
attribute Set<String> PhoneN; 
// relationships among instances of the type 
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relationship PERSON Spouse; 
relationship Set <PERSON> Child; 
// methods of instances of the type 
void add_phone_number(in String phone) ; 


} 


// A literal type 

struct ADDRESS 

{ String StNumber; 
String StName; 


这 个 例子 定义 了 一 个 接口 、 一 个 类 和 一 个 文字 类 型 。PERSONINTERFACE: Object 语句 说 明 
PERSONINTERFACE 是 继承 层次 结构 中 object 的 孩子 。Object 是 内 建 的 接口 定义 ， 它 提供 所 有 对 象 
共有 的 方法 (如 delete()、copy0 〇 和 same_as()) 的 签名 。( 一 个 对 象 same_as 另 一 个 对 象 在 当 且 
仅 当 它们 有 相同 oid 时 成 立 。 ) 类 似 地 ，PERSON: PERSONINTERFACE 声 明 类 PERSON 从 接口 
PERSONJNTERFACE 接 口 继承 。 在 这 个 例子 中 ，PERsoN 不 是 任何 ODMG 类 的 子 类 。 

以 extent 和 key 开 始 的 语句 指定 PERSON 的 类 型 。extent 给 出 了 所 有 PERSON 对 象 组 成 的 集合 的 
名 字 。 按 照 关系 DBMS 的 观点 ， 数 据 定义 语言 中 的 类 名 和 外 延 名 之 间 的 不 同 相当 不 寻常 。 这 就 
像 给 关系 模式 赋予 一 个 名 字 ( 即 用 于 语 名 CREATE TABLE 语句 的 符号 )， 而 该 模式 下 的 实际 关 
系 实例 被 赋予 另 一 个 名 字 。 无 论 按 照 概念 的 观点 还 是 实际 的 观点 ， 外 延 的 值 都 比较 可 疑 。 

key 语 句 声明 extent 有 两 个 不 同 的 候选 键 : SSN 和 <Name,PhoneN>。 换 句 话 说 ， 这 种 类 型 
没有 具有 相同 SSN 或 相同 的 姓名 和 电话 号 码 的 不 同 对 象 。 

规格 说 明 余下 的 部 分 定义 了 与 接口 PERSONINTERFACE、 类 PERSON 和 文字 类 型 ADDRESS 相 
关 的 类 型 (CODM 意 义 上 )。 这 些 类 型 的 每 一 个 实例 都 有 数 个 方法 和 属性 。PERSONINTERFACE 
的 方法 Name() 返 回 基本 类 型 String。 方 法 Sex0 〇 返回 枚 举 类 型 ， 其 值 可 能 为 m 或 f。 类 PERsoN 的 
Address 属 性 有 用 户 定 义 类 型 ADDRESS， 即 在 PERSON 定 义 中 给 出 的 文字 类 型 。 PhoneN 属 性 为 
集合 类 型 ， 集 合 的 每 个 成 员 为 string 类 型 ， 用 ODMG 中 的 接 品 set 表示。 注意 ， 因 为 接口 中 只 能 
定义 方法 ， 所 以 例子 中 Name()、SSNO 和 Sex0 都 是 方法 。 

ODMG 区 分 属性 (attribute) 和 联系 (relationship )。 属 性 的 值 是 存储 在 特定 对 象 中 的 文 
FRE (不 是 对 象 ) 。 联 系 指 存储 在 数据 库 中 的 其 他 对 象 。 它 指出 对 象 与 特定 对 象 如 何 相关 。 
PERSON 定 义 包含 两 个 联系 。Spouse 是 对 应 于 特定 对 象 的 资助 人 的 另 一 个 PERSON 对 象 (单独 存 
储 的 )。Child 为 PERsoN 对 象 集合 〈 也 是 单独 存储 的 )， 它 列 出 关于 特定 的 人 的 所 有 子 对 象 。 

但 是 ，ODMG 使 用 的 术语 “联系 ”与 E-R 模 型 中 使 用 的 “联系 ” 相 冲突 。 除 了 联系 涉及 对 
象 而 非 值 以 外 ，ODMG 的 联系 与 属性 非常 相似 。 相 反 ，E-R 联 系 与 对 象 相似 并 且 通 过 属性 和 角 
色 来 表示 自身 的 结构 。 事 实 上 ，E-R 角 色 的 概念 对 应 于 ODMG 联 系 的 概念 ， 因 为 角色 本 质 上 是 
一 个 定义 域 为 实体 集合 的 属性 (而 不 是 基本 类 型 ， 如 整 型 和 字符 串 )。 

除了 指定 属性 与 联系 外 ， 类 定义 也 可 以 有 方法 签名 (在 宿主 语言 中 单独 提供 了 方法 的 实 
现 )。 在 我 们 的 例子 中 ， 方 法 add_phone_number() 的 签名 已 经 指定 了 。 方 法 的 参数 列表 中 的 关 
键 字 in 指 定 参 数 的 传递 模式 (parameter passing mode) ; 这 里 是 说 参数 phone 是 输入 参数 。 这 
个 特性 是 从 CORBA 的 接口 定义 语言 (在 第 10 章 的 SQL/PSM 中 也 可 见 到 )“ 借 来 的 ”。 其 他 的 
参数 传递 关键 字 是 out 和 inout ( 输出 参数 和 输入 输出 都 可 用 的 参数 )。 
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上 面 的 ADDRESS 规 格 说 明定 义 了 一 个 ODMG 文 字 类 型 ( 它 的 实例 是 CODM 术 语 中 的 
“ 值 ” )。 对 于 这 个 定义 ，ODMG 使 用 关键 字 struct 而 不 是 class。 文 字 只 有 属性 没有 联系 ， 所 以 
关键 字 attribute 和 relationship 在 文字 的 定义 中 并 不 需要 。 

定义 另 一 个 ODMG 类 STUDENT 来 继续 开发 上 述 例子 : 


class STUDENT extends PERSON { 
(extent STUDENTEXT) 


attribute Set<String> Major; 
relationship Set<COURSE> Fnrolled; 


} 


子 句 STUDENT extends PERSON 使 STUDENT 成 为 类 PERSON 的 子 类 。 注 意 ，ODMG 使 用 “: ”表示 
从 接口 继承 ， 关 键 字 extends 代 表 从 类 继承 。 从 类 的 定义 继承 意味 着 除了 属性 和 方法 签名 外 还 
继承 了 方法 的 实现 。 此 外 ，STUDENT 的 外 延 成 为 PERSON 外 延 的 子 集 。 

ODMG 的 继承 模型 与 Java 的 继承 模型 类 似 。 一 个 ODMG 类 只 能 继承 另 一 个 ODMG 类 ， 
但 是 可 以 从 多 个 ODMG 接 口 继承 方法 签名 。 然而 , ODMG 禁 止 名 字 重 载 (name overloading): 
具有 特定 名 字 的 方法 不 能 从 超过 一 个 类 或 接口 继承 。 例 如 ， 如 果 LIBRARIAN 定 义 为 FACULTY 
和 STAFF 的 子 类 ， 则 FACULTY 和 STAFF 不 能 拥有 一 样 的 方法 名 ， 如 weeklyPay。( 注 意 ， 
在 LIBRARIAN 的 例子 中 ， 由 于 不 能 从 多 个 类 继承 ， 所 以 FAcuLTY 或 STAFF 或 二 者 都 必须 是 
接口 。) 

STUDENT 定义 中 的 联系 Enrolled 说 明 学 生 参 加 了 一 组 课程 ， 其 中 COURSE 是 一 个 单独 定 
义 (存储 ) 的 对 象 。COURSE 的 定义 是 : 


class COURSE : Object { 
(extent COURSEEXT) 
attribute Integer CrsCode; 
attribute String Department; 
relationship Set<STUDENT> Enrollment; 


} 


联系 Enrollment 建立 了 一 门 课 程 和 参加 该 课 的 学 生 间 的 关联 。 

这 些 联系 声明 自动 地 强制 执行 我 们 在 SQL 中 知道 的 参照 完整 性 。 例 如 ， 如 果 从 数据 库 中 
删除 一 个 课程 对 象 ， 则 系统 也 会 自动 地 从 由 STUDENT 对 象 的 Enrolled 属 性 返回 的 课程 集合 中 删 
除 相应 的 课程 对 象 。 类 似 的 ， 如 果 删 除 一 个 SrTUDENT 对 象 ， 系 统 也 将 从 参加 相应 课程 的 学 生 集 
合 中 删除 该 对 象 。 

ODMG 标 准 不 提供 类 似 SQL 中 ON DELETE CASCADE 语 句 的 机 制 ， 对 这 类 删除 起 作用 。 
然而 ， 可 以 通过 ODMG 的 异常 (exception) 机 制 获 得 几乎 同样 的 功能 (这 里 就 不 再 讨论 了 )。 

ODL 也 可 以 自动 维护 由 联系 Enrolled 和 Enrollment 返 回 的 值 之 间 的 一 臻 性。 如 果 john 是 类 
STUDENT 的 一 个 对 象 ， john Enrolled 包含 课程 CS$32, 但 是 CS532.Enrollment 的 值 不 包含 john, 则 
数据 库 是 不 一 致 的 。 为 了 避免 出 现 这 种 情况 ， 数 据 库 设计 者 可 以 指出 Enrollment 联 系 是 
Enrolled 关 系 的 inverse， 反 之 亦 然 。 
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class STUDENT extends PERSON { 
(extent STUDENTEXT) ; 


attribute Set<String> Major; 
relationship Set<COURSE> Enrolled; 
inverse COURSE: : Enrollment; 
} (16.8) 
class COURSE : Object { 


relationship Set<STUDENT> Enrollment; 
inverse STUDENT: :Enrolled; 


} 


这 里 ， 语 名 relationship Set<Course> Enrolled; inverse CourRsE::Enrollment 说 明 ， 如 果 一 个 
COURSE 对 象 c 在 s.Enrolled 集 合 中 (其 中 s 是 一 个 STuDENT 对 象 ) 则 s 必 须 在 集合 c.Enrollment 中 。 
语句 relationship Set<STUDENT>Enrollment;inverse STUDENT::Enrolled 说 明 对 等 包含 (opposite 
inclusion)。 注 意 ， 这 种 约束 的 功能 比 参 照 完整 性 更 加 强大 ， 引 用 一 致 性 仅 能 保证 没有 学 生 注 
册 一 门 假 的 课程 ， 并 保证 课程 花 名 册 (rosters) 不 包含 幻影 (phantom) 学 生 。 


16.4.2 OQL: ODMG 对 象 查询 语言 


尽管 对 象 能 通过 它们 的 方法 和 属性 直接 进行 查询 ，ODMG 还 是 提供 了 一 个 强大 的 声明 性 
查询 语言 来 访问 对 象 数据 库 。 和 在 关系 数据 库 中 一 样 ，ODMG 查 询 可 以 交互 式 地 发 出 或 谋 人 
到 应 用 (程序 ) 中 。 然 而 ， 由 于 许多 厂商 不 支持 交互 模式 ， 所 以 嵌入 式 查询 是 实际 中 最 为 常 
用 的 。 伐 入 式 查询 的 语法 依赖 于 宿主 语言 。16.4.5 节 解释 了 如 何在 Java 中 实现 嵌入 式 查询 。 本 
节 讨 论 独立 于 上 述 模式 的 查询 语言 本 身 的 内 容 。 

ODMG 对 象 查询 语言 (OQL) 在 许多 方面 与 SQL 查询 语言 的 子 集 类 似 。 例 如 ， 查 询 

SELECT DISTINCT S.Address 

FROM PERSONEXT S 

WHERE S.Name = "Smith" 
返回 所 有 名 为 Smith 的 人 的 地 址 集合 。 更 准确 地 说 ， 它 返回 一 个 Set<Address> 类 型 的 值 。 集 
合 类 型 与 内 建 方法 使 得 程序 员 可 以 存 取 集 合 的 元 素 以 获得 SQL 中 游标 提供 的 功能 。 

回想 一 下 ，ODMG 清 楚 地 区 分 类 名 和 类 的 外 延 名 。 在 FORM 子 旬 中 出 现 的 是 类 的 外 延 名 
而 不 是 类 名 。 所 以 上 例 使 用 符号 PERSONEXT， 表 示 类 PERSON 的 外 延 ( 即 所 有 对 象 的 集合 )。 

在 上 述 查 询 中 ， 如 果 关 键 字 DISTINCT 从 SELECT 语句 中 略 去 ， 那 么 查询 将 返回 一 个 
Bag<Address> 类 型 的 值 ， 地 址 包 (bag) ( 包 类 似 于 集合 ， 但 是 可 以 有 重复 元 素 )。 

方法 也 能 在 SELECT 语句 中 调用 。 使 用 (16:4) 中 定义 的 MOVIE 对 象 示例 ， 可 以 利用 如 
下 查询 

SELECT M.frameRange (100, 1000) 


FROM MoviE M 
WHERE M.Name = "The Simpsons" 


O 注意 ,不 同 于 SQL，OQL 使 用 双 引 号 表示 字符 串 常 量 ， 即 表示 为 “Smith” 而 不 是 “Smith ' 。 





PIO HEKE 375 


来 调用 frameRange() 方 法 ， 访 方法 返回 一 组 帧 的 范围 对 象 ， 每 一 个 对 象 对 应 一 个 名 称 为 
“Simpsons” 的 电影 。 如 果 frameRange() 已 经 在 继承 层次 结构 中 进行 了 重新 定义 ， 那 么 系统 将 
根据 继承 规则 选择 正确 的 版 本 。 有 或 没有 参数 的 方法 都 可 以 在 查询 的 任何 位 置 使 用 9 。 
调用 方法 的 SELECT 语句 可 能 有 副作用 。 例 如 ， 如 果 PERSON 类 有 一 个 更 新 个 人 电话 号 码 
的 方法 ， 那 么 可 以 写 出 如 下 的 OQL 查 询 ， 其 中 在 SELECT 子 句 中 调用 更 新 方法 : 
SELECT S.add_phone_number ("555-1212") 


FROM PERSONEXT S 
WHERE §.SSN = "123-45-6789" 


这 个 查询 改变 了 数据 库 ， 但 是 并 不 向 调用 者 返回 任何 信息 。 

在 OQL SELECT 语句 中 调用 更 新 方法 的 能 力 模糊 了 数据 操纵 语言 与 数据 查询 语言 的 界限 。 

SELECT 语句 的 语法 和 SQL 一 样 ， 也 包含 复杂 WHERE 谓词 、 联 结 、 聚 合 、 分 组 、 排 序 等 。 

1. 路 径 表 达 式 

路 径 表 达 式 是 OQL 的 关键 部 分 ; 它 使 得 查询 可 以 深入 到 复杂 属性 以 及 执行 对 象 的 方法 。 
如 16.1 节 所 指出 的 ， 该 技术 可 以 相当 大 地 简化 查询 的 表达 。 例 如 ， 


SELECT DISTINCT S.Address.StName 
FROM PERSONExT S 
WHERE S.Name = "Smith" 


返回 所 有 名 为 Smith 的 人 的 地 址 中 的 街道 名 对 应 的 字符 串 集合 (类 型 为 Set<String> 的 值 )。 
在 SELECT 语 句 中， 任何 可 以 使 用 属性 的 地 方 都 可 以 使 用 联系 。 例 如 ， 下 面 的 查询 用 联系 
Spouse 代 替 属 性 Address 。 


SELECT S.Spouse.Name() 
FROM PERSONEXT S 
WHERE S.Name = "Smith" 


返回 名 为 Smith 的 人 (数据库 中 可 能 有 几 个 Smith ) 的 相应 的 资助 人 的 名 字 (类 型 为 


(16.9) 


Set<String> 的 值 ) 。 
形式 化 地 说 ， 路 径 表达 式 (path expression) 为 如 下 形式 : 
P.namel.name2. ... . name, 


其 中 P 可 以 是 对 象 或 定义 域 为 对 象 的 变量 ， 并 且 每 一 个 name; 可 以 是 属性 名 ， 方 法 调用 HS 
数 )， 或 联系 名 。 例 如 ， 表 达 式 M.frameRange(100,1000).play() 就 调用 了 方法 。 

路 径 表 达 式 必须 具有 类 型 一 致 性 (type consistent)。 在 上 面 例子 中 ， 我 们 用 

S. Address .StName 
返回 所 有 名 为 Smith 的 人 的 地 址 中 的 StName。 该 表达 式 具 有 类 型 一 致 性 ， 原 因 如 下 : 

“变量 S 引 用 PERSON 类 型 的 对 象 。 

。 类 型 PERSON 具 有 Address 属 性 。 

。 子 表达 式 S.Address 返 回 ADDRESS 类 型 的 值 。 

。 类 型 ApDRESS 具 有 StName 属 性 。 


但 ”如 果 方 法 的 结果 用 于 其 他 一 些 表达 式 ， 那 么 会 存在 类 型 化 限制 。 如 X.ageO=Y.frameRange(100,1000) 为 类 型 
错误 。 
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E (16.3) 用 到 了 路 径 表 达 式 

P.Child.Child.PhoneN (16.10) 
该 表达 式 表 示 对 象 P 的 所 有 孙子 的 电话 号 码 集合 。 但 是 ， 该 路径 表达 式 又 有 了 新 的 问题 。 一 
个 人 可 能 有 多 于 一 个 的 子女 , 所 以 , 这 里 的 问题 由 子 表达 式 PChild 返 回 的 结果 的 性 质 所 引起 。 
它 是 一 组 对 象 吗 ? 其 中 每 一 个 对 象 都 属于 PERSON 类 型 ， 还 是 属于 Set<PERSON> 类 型 的 单个 集 
合 对 象 ? 

在 一 些 面向 对 象 的 查询 语言 中 (如 XSQLIKifer et al. 1992])，P.Child 是 一 组 对 象 。 所 以 
在 XSQL 中 ， 可 以 连续 应 用 Child， 然 后 应 用 每 一 个 孩子 的 PhoneN。 最 后 ， 得 到 P 的 所 有 孙子 
的 电话 号 码 集合 。 但 是 ， 在 OQL 中 ，P.Child 返回 一 个 Set<PERsoN> 类 型 的 集合 对 象 。 由 于 这 
个 集合 对 象 不 是 PERSON 类 型 的 ， 所 以 没有 为 其 定义 属性 Child。 只 要 涉及 OQL， 表 达 式 
(16.10) 就 会 有 类 型 错误 ! 

OQL5 引 入 了 一 个 专门 的 操作 符 flatten， 其 目的 是 分 解 集合 对 象 和 其 他 聚合 对 象 (如 列表 )。 
例如 ，flatten(Set<1,2,3>) 是 一 个 对 象 的 集合 {1,2,3} ， 而 不 是 单个 的 集合 对 象 。 所 以 ， 在 XSQL 
P, RER (16.10) 是 正确 的 。 而 在 OQL 中 ， 相 应 的 表达 式 会 比较 麻烦 : 

flatten (flatten (P .Child) .Child) .PhoneN 

2.OQL 中 的 嵌 套 查询 

和 在 SQL 中 一 样 ， 一 些 OQL 查 询 需 要 侈 套子 查询 机 制 。 回 想 一 下 ， 在 SQL 中 ， 焦 套子 查 
询 出 现在 两 个 地 方 : 

“出 现在 FROM 子 句 中 ， 指 明 元 组 变量 的 有 效 取 值 范围 (例如 ,查询 (6.26) )。 

“出 现在 WHERE 子 句 中 ， 指 明 复 合 查询 条 件 (例如 ,查询 (6.22) )。 

与 SQL 中 的 原因 相同 ， 向 套子 查询 可 以 出 现在 0QL 的 FROM 和 WHERE 子 句 中 。 但 是 ， 如 
果 需 要 构造 一 个 集合 对 象 并 且 作 为 查询 结果 返回 ， 那 么 OQL 查 询 在 SELECT 子 句 中 也 可 以 有 
人 风 套 子 查询 。 显 然 ， 这 种 情况 是 面向 对 象 查询 语言 所 特有 的 ， 因 为 在 关系 模型 中 集合 对 象 不 
能 作为 元 组 的 组 成 部 分 出 现 。 

为 了 进行 说 明 ， 假 设 需 要 得 到 所 有 学 生 以 及 他 们 所 学 的 计算 机 科学 课程 的 列表 。 我 们 希 
望 输出 是 一 组 元 组 ， 其 中 第 一 个 属性 为 基本 类 型 String ， 而 第 二 个 属性 为 Set<Course> 类 型 。 

SELECT struct{ name: S.Name, 

courses: (SELECT E 


FROM S.Enrolled E 


WHERE E.Department="CS") (16.11) 


FROM srupentExr S 

这 里 ，SELECT 语句 中 的 嵌 套 查询 产生 一 个 赋予 属性 courses 的 集合 。 这 个 嵌 套 查询 的 目 
的 是 生成 一 个 复杂 的 嵌 套 结构 ， 这 在 SQL 中 不 可 能 发 生 (所 以 除了 返回 单个 标量 值 的 子 查询 
外 ，SQL 中 不 允许 复杂 的 嵌 套 查询 )。 注 意 我 们 使 用 了 C 语 言 风格 的 struct 结 构 告诉 0OQL， 查 询 
的 输出 将 视 为 复杂 值 的 集合 。 

3. 聚合 和 分 组 

OQL 提 供 常 见 的 聚合 国 数 (如 sum、count、avg 等 )。 从 第 6 章 中 ， 我 们 知道 聚合 主要 与 分 
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组 一 起 使 用 。 在 SQL 中 ， 分 组 需要 一 个 专门 的 子 句 GROUP BY。 有 趣 的 是 ，OQL 分 组 可 以 使 
用 SELECT 语句 中 的 供 套 子 查询 完成 ， 不 需要 专门 的 分 组 语句 。 

具体 地 说 ,考虑 查询 (16.11)。 它 的 输出 为 元 组 集合 , 其 中 第 一 个 组 成 部 分 是 学 生 的 姓名 ， 
第 二 个 部 分 是 学 生 参 加 的 课程 集 。 所 以 ， 输 出 已 经 进行 了 分 组 。 通 过 一 些小 的 改动 ， 可 以 把 
上 面 的 例子 转换 为 产生 一 个 学 生 以 及 每 个 学 生 参 加 的 计算 机 科学 课程 的 总 数 的 列表 。 结 果 与 
使 用 GROUP BY 语句 的 SQL 语 句 一 样 。 

SELECT name: S.Name, 

count: count(SELECT E.CrsCode 
FROM S.Enrolled E 
WHERE E.Department="CS") 

FROM STUDENTEXT S 
即使 GROUP BY 在 OQL 中 并 非 必须 的 ， 但 它 仍 与 HAVING 语 名 一 起 被 提供 。 然 而 ， 它 的 存在 
并 没有 增加 语言 的 表达 能 力 或 作为 语法 修饰 成 分 ， 即 语言 的 表达 能 力 没 有 变化 。 在 大 多 数 情 
况 下 ，GROUP BY 并 没有 简化 查询 的 表述 。 相 反 ， 它 可 以 作为 查询 优化 器 的 提示 (hint), H 
它 可 以 构建 一 个 较 好 的 查询 执行 计划 。 

下 面 进行 一 些 解释 ， 考 虑 查询 处 理 器 如 何 执行 上 述 查 询 。 为 了 有 效 地 回答 上 述 查 询 ， 查 
询 处 理 器 必须 把 课程 对 象 分 组 ， 其 中 每 一 组 代表 某 个 学 生 参 加 的 课程 的 列表 。 然 而 ， 查 询 优 
化 器 不 太 可 能 自己 判断 出 需要 以 学 生 为 单位 对 课程 分 组 。 所 以 可 行 的 计划 是 扫描 STUDENTExT 
并 对 $ 的 每 一 个 值 执行 子 查询 。 另 一 方面 ， 优 化 器 会 以 不 同 的 方法 处 理 下 面 的 查询 。 : 

SELECT S.Name, count: count(E.CrsCode) 

FROM STUDENTEXT S, S.Enrolled E 


WHERE E.Department = "CS" 
GROUP BY S.SSN 


在 这 个 查询 中 ，FROM 语 名 产生 oid 对 的 序列 <s,e>, 其 中 e 为 课程 的 oid， 具 有 相应 oid 的 学 . 
生 s 选 修了 该 课程 。 

由 于 使 用 了 GroupBy 语 句 ， 优 化 器 现在 知道 课程 必须 按 选 修 它 的 学 生 分 组 ， 所 以 可 以 用 使 
结果 元 组 正确 分 组 的 方法 联结 SrupENT 和 CouRsE 类 。 一 种 实现 方法 是 扫描 类 CouRsE 的 实例 ， 
并 且 对 于 每 一 门 课 程 c， 按 每 一 个 参加 课程 c 的 学 生 的 oid 进 行 散 列 。 结 果 ， 课 程 的 oid 将 被 放置 
在 桶 中 ， 按 这 种 方法 同一 学 生 参 加 的 所 有 课程 将 在 同一 桶 中 。 所 以 ， 可 以 通过 扫描 同一 个 桶 
来 完成 联结 计算 并 统计 每 一 个 学 生 选 修 的 课程 数 。 


16.4.3 ODMG 中 的 事务 - 


事务 在 初始 化 之 前 ， 必 须 打开 引用 事务 所 访问 的 数据 库 的 数据 库 对 象 (database object). 
通过 一 个 内 建 的 接口 DatabaseFactory 实 现 数据 库 对 象 的 生成 、 打 开 和 关闭 。 所 以 ,调用 

dbi = DatabaseFactory.new(); 
产生 新 的 数据 库 对 象 并 返回 一 个 引用 db1。 这 个 引用 能 够 用 于 下 面 的 调用 : 

dbi.open(in String database_name); 


© 这 里 我 们 为 了 兼容 SQL 使 用 GROUP BY 的 所 谓 的 “替换 语法 *。OQL 中 的 正式 的 GROUP BY 语法 比较 复杂 ， 
但 是 功能 更 强 。 这 里 就 不 介绍 了 。 
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它 将 打开 名 为 database_name 的 数据 库 。 语 句 
db1i.close(); 
关闭 该 数据 库 。 一 次 只 能 打开 一 个 数据 库 。 
ODMG 有 一 个 内 建 的 接口 TransactionFactory， 它 用 来 产生 新 的 事务 对 象 以 访问 当前 打开 
的 数据 库 。 所 以 ， 调 用 
transl = TransactionFactory.new() ; 
产生 一 个 新 的 事务 对 象 并 返回 一 个 引用 trans1。 这 个 引用 能 够 用 于 下 面 的 调用 


trans1.begin(); 
transi.commit(); 
trans1.abort(); 


来 执行 指定 操作 。ODMG 假 设 软件 三 商 将 提供 实现 上 述 接口 的 类 。 


16.4.4 ODMG 中 的 对 象 操纵 


对 象 操纵 语言 处 理 对 象 的 产生 、 删 除 和 更 新 。 然 而 ，ODMG 数 据 库 通常 不 支持 单独 的 数 
据 操纵 语言 ， 因 为 宿主 语言 提供 了 该 功能 。ODMG 语 言 绑 定 〈 下 节 介 绍 ) 说 明 用 宿主 语言 能 
语法 如 何 完成 对 象 操纵 。 例 如 ， 为 了 生成 新 的 数据 库 对 象 ，C++ 和 Java 使 用 new 构造 函数 。 在 
宿主 语言 中 ， 删 除 和 修改 对 象 可 以 通过 调用 相应 类 的 方法 来 完成 。 

另 一 种 更 新 对 象 的 方法 是 调用 SELECT 语句 中 的 方法 ， 如 (16.9) 所 示 。 这 种 技术 能 够 用 
来 更 新 满足 某 些 条 件 的 对 象 集合 。 


16.4.5 语言 绑 定 


ODMG 的 目标 之 一 就 是 鼓励 厂商 实现 基于 ODMG 数 据 模型 的 商用 对 象 DBMS。 和 关系 数 
据 库 系统 一 样 ， 对 象 数据 库 的 大 部 分 应 用 用 宿主 语言 编写 。ODMG 的 一 个 重要 目标 是 为 这 些 
程序 提供 统一 的 访问 数据 库 的 方法 ， 特 别 是 C++，SMALLTALK，Java。 所 有 这 些 语 言 都 是 
面向 对 象 的 ， 并 且 包 含 指定 和 产生 类 似 那些 在 ODL 中 的 对 象 的 功能 。 为 了 让 这 些 语言 访问 
ODMG 数 据 库 ， 为 它们 各 自 定 义 了 语言 绑 定 (language binding). ER PP RRR FE 
题 : 
。 把 ODL 对 象 定义 映射 到 宿主 语言 固有 的 语法 为 了 更 好 地 理解 这 个 问题 回想 一 下 Java、 
C+t+ 以 及 其 他 宿主 语言 不 理解 ODL 的 语法 。 所 以 ， 如 何 用 这 些 语言 来 定义 ODMG 模 式 
W? 一 种 方法 是 使 用 语句 级 的 接口 ， 以 便 ODL 语 句 能 够 直接 插入 到 宿主 语言 程序 中 。 然 
后 预 处 理 器 把 这 些 语句 转换 为 对 相应 的 数据 库 库 程序 的 调用 。 这 是 嵌入 式 SQL 采 用 的 方 
法 ， 如 10.2 节 所 讨论 的 。 但 是 ，ODMG 采 用 了 不 同 的 方法 。 不 是 修改 宿主 语言 ， 而 是 在 
宿主 语言 中 定义 一 系列 的 类 和 接口 ， 表 示 ODL 中 相应 的 概念 。DBMS 库 必须 确保 对 于 这 
些 在 宿主 语言 中 的 类 的 实例 的 操作 在 数据 库 对 象 上 得 到 了 正确 的 反映 。 
“从 窒 主 语言 内 访问 和 查询 对 象 ” 访 问 数据 库 的 方法 是 把 运行 时 对 象 (根据 宿主 语言 的 固 
有 的 机 制定 义 ) 绑 定 到 数据 库 对 象 。 然 后 通过 将 带 有 数据 库 对 象 的 类 的 方法 应 用 到 运行 
时 对 象 对 数据 库 对 象 进行 查询 和 修改 。 访 问 对 象 的 更 有 效 的 方法 是 向 服务 器 发 送 OQL 查 
if) ( 即 SELECT 语 句 ) ， 发 送 方法 在 概念 上 与 ODBC 和 JDBC 中 的 方法 类 似 。ODMG 绑 定 
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采用 了 上 述 两 种 方法 。 
例如 ， 考 虑 下 面 Java 中 的 类 : 


public class STUDENT extends PERSON { 
public DSet Major; 
// Plus, possibly, other attributes 

} 


这 里 ，DSet 是 ODMG 定 义 的 对 应 于 ODL 接 口 Set 的 Java 接 口 。 定 义 DSet 的 原因 是 现 有 的 Java 接 
口 未 提供 ODL 中 的 Set 的 全 部 功能 。 要 为 学 生 添加 一 个 专业 ， 可 以 调用 STUDENT 对 象 上 的 固有 
的 Java 方 法 : 
STUDENT X; 
« hajor_a0aces") 
其 中 add 是 一 个 应 用 于 DSet 对 象 的 方法 。 所 有 语言 绑 定 的 主要 设计 原则 是 在 ODMG 对 象 上 使 用 
固有 的 宿主 语言 功能 ( 可 以 稍 有 变化 )， 从 而 消除 阻抗 不 匹配 。 但 是 ， 实 现 标准 所 需要 的 许多 
功能 在 某 些 或 所 有 宿主 语言 中 都 不 存在 。 结 果 ，ODMG 语 言 绑 定 缺乏 语法 (有 时 为 概念 上 的 ) 
的 统一 性 ， 而 且 其 细节 在 不 同 的 宿主 语言 上 也 有 很 大 的 不 同 。 为 了 说 明 其 中 的 困难 ， 可 以 考 
虑 如 下 的 问题 : - 
。 话 言 绑 定 如 何 区 分 特定 类 的 持久 对 象 和 眸 时 对 象 ? 例如 ， 一 个 使 用 数据 库 中 的 数据 项 的 
应 用 同时 具有 持久 对 象 和 瞬时 对 象 。 持 久 对 象 直接 绑 定 到 要 更 新 的 数据 库 对 象 ， 而 瞬时 
对 象 并 不 直接 对 应 于 数据 库 中 存储 的 信息 ， 但 是 它们 由 应 用 逻辑 使 用 (如 显示 表单 ， 保 
存 计算 的 中 间 结 果 )。 
对 于 此 问题 ， 每 一 种 语言 都 有 自己 的 解决 方法 。 首先， 类 必须 声明 为 可 持久 化 
(persistence capable)， 三 种 语言 的 实现 各 不 相同 。 其 次 ， 需 要 自动 存储 在 数据 库 中 的 可 
持久 化 类 的 任何 对 象 必 须 显 式 地 进行 持久 化 。 为 此 ，C++ 绑 定 使 用 一 个 专门 形式 的 
new() 方 法 。 在 Java 绑 定 中 ， 通 过 定义 在 接口 Database 中 的 专门 方法 makePersistentO 实 现 
对 象 的 持久 化 ， 对 象 持久 化 的 另 一 种 方法 是 它 被 已 经 持久 化 的 对 象 所 引用 。 此 后 ， 由 数 
据 库 负 责 确 保 对 象 存储 在 数据 库 中 。 
*。 绑 定 如 何 表 示 和 实现 联系 ? 这 3 种 语言 在 原始 形式 下 都 设 有 实现 联系 。Java 绑 定 的 现在 
版 本 不 支持 联系 ，C++ 和 Smalltalk 绑 定 通过 定义 专门 的 类 和 方法 实现 了 联系 。 
。 如 何 表示 ODMG 的 文字 ? 在 C++ 中 ， 文 字 用 关键 字 struct 表 示 ， 但 是 在 Smalltalk 和 Java 中 
文字 不 能 直接 表示 ， 必 须 映射 到 对 象 。 | 
“如 何 执行 OQL 查 询 ? 每 一 种 语言 都 有 自己 的 实现 ,但 是 它们 基本 上 都 依靠 类 似 JDBC 中 
采用 的 机 制 (参见 10.5 节 ): 实例 化 一 个 查询 对 象 ， 把 OQL 查 询 作为 一 个 参数 化 的 字符 
串 提供 给 查询 对 象 ， 通 过 使 用 专门 的 方法 可 以 把 查询 中 的 参数 实例 化 为 特定 的 对 象 。 然 
后 ， 通 过 利用 查询 对 象 的 execute() 方 法 执行 查询 。 
。 数据 库 是 如 何 打 开 与 关闭 的 ? 事务 是 如 何 执行 的 ? 每 一 种 语言 都 有 预先 定义 的 对 应 于 
ODL 中 的 database 和 transaction 对 象 的 类 ， 这 些 类 包含 执行 查询 操作 的 适当 的 方法 。 
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Java 绑 定 示例 

为 了 使 上 述 讨 论 更 加 具体 ， 我 们 探讨 一 下 如 何 用 Java 绑 定 执行 OQL 查 询 。 。 

ODMG 和 宿主 语言 绑 定 为 查询 对 象 提 供 两 种 补充 机 制 : OQL 查 询 (使 用 OQLQuery 类 )、 由 
DCollection 接 口 定义 的 方法 。 前 者 从 数据 库 中 抽取 对 象 集 并 赋 给 Java 变 量 ; 后 者 对 使 用 第 一 
种 方法 从 数据 库 中 检索 到 的 对 象 集 (并 且 存 储 在 Java 变 量 中 ) 进行 查询 ， 下 面 将 对 两 种 机 制 
进行 解释 。。 

为 了 使 用 OQLQuery 方 法 ， 要 用 OQLQuery 类 的 构造 器 方法 创建 一 个 查询 对 象 。 这 个 类 中 
的 一 些 方法 是 : 

class OQLQuery { 

public OQLQuery (String query); // query constructor 


public bind(Object parameter); // supplies arguments 
public Object execute(); // executes queries 


OQLQuery 构 造 器 接收 一 个 包含 OQL 查 询 (一 条 SELECT 语句 ) 的 字符 串 作为 输入 并 生成 一 
个 查询 对 象 。OQL 查 询 本 身 可 以 用 占 位 符 (placeholder) ($1, $2 等 ) 参数 化 ， 它 们 分 别 对 
应 动态 SQL、JDBC 和 ODBC 中 的 “?” 占 位 符 (第 10 章 )。 这 些 自 变量 可 以 使 用 bind0) 方 法 
替换 为 实际 的 Java 对 象 。 当 查询 对 象 中 的 所 有 占 位 符 都 绑 定 后 ， 可 以 通过 execute() 方 法 执 
行 查 询 。 

例如 ， 下 面 的 程序 段 计算 1999 春 季 只 有 计算 机 科学 专业 的 学 生 参 加 的 课程 : 


DSet students, courses; 
String semester; 
OQLQuery queryi, query2; 
queryl = new OQLQuery("SELECT S FROM STUDENT S " 
. + "WHERE \"CS\" IN S.Major"); 
students = (DSet) queryl.execute(); 
query2 = new OQLQuery("SELECT T FROM COURSE T " 
+ "WHERE T.Enrollment.subsetOf($1) ° 

， + "AND T.Semester = $2"); 
semester = new String("S1999"); 
query2.bind(students); // bind $1 to the value of students 
query2.bind(semester); // bind $2 to the value of semester 
courses = (DSet) query2.éxecute(); 


变量 students 和 courses 定 义 为 类 型 DSet， 该 类 型 是 对 应 于 ODL 中 的 接口 Set 的 Java 接 口 。 从 概 
念 上 讲 ， 可 以 想象 Java 绑 定 把 接口 DSet 映 射 到 了 ODL 的 接口 Set， 

接 下 来 ， 变 量 students 被 赋予 了 一 个 集合 对 象 ， 该 集合 对 象 包含 代表 计算 机 科学 系 中 学 生 
的 所 有 对 象 。 这 个 集合 对 象 可 以 通过 先生 成 一 个 OQL 查 询 对 象 ， 然 后 调用 它 的 execute() 方 法 
得 到 。 


O ”预计 目前 的 Java 绑 定 将 被 前 面 提 到 的 即将 出 现 的 Java 数 据 对 象 规格 说 明代 赫 。 但 是 ， 对 于 现在 的 和 即将 出 
现 的 规格 说 明 ， 从 应 用 程序 中 对 数据 库 对 象 进行 访问 的 原则 是 一 样 的 。 

日 。 注意， 这 种 设计 具有 相当 严重 的 阻抗 不 匹配 ， 因 为 该 设计 使 用 单独 的 语言 0QL 从 数据 库 中 检索 对 象 。 我 们 
在 前 面 讨 论 了 这 个 问题 ， 提 到 即将 出 现 的 Java 数 据 对 象 规格 说 明 的 目的 就 是 为 了 克服 这 个 问题 。 
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注意 ， 第 一 个 OQL 查 询 的 目标 列表 只 含有 一 个 DSet 类 型 的 变量 。 查 询 返 回 一 个 oid 集 合 ， 
把 结果 赋予 一 个 DSet 变 量 ， 使 之 能 够 存 取 相应 的 对 象 并 且 能 够 对 它们 应 用 方法 。 实 际 上 ， 
execute() 的 签名 说 明 该 方法 返回 一 个 类 Object 的 成 员 ， 所 以 必须 把 结果 转换 为 DSet 类 。 

下 一 步 生 成 另 一 个 查询 对 象 ， 并 将 其 保存 在 变量 query2 中 。 方 法 subsetOf() 根 据 集合 
T.Enrollment 是 否 为 作为 参数 $1 的 集合 的 子 集 而 返回 值 true 或 false 。 第 二 个 查询 没有 完全 指定 ， 
它 是 一 个 查询 模板 (query template )， 因 为 它 包 含 两 个 占 位 符 。 第 一 个 ($1 ) 已 经 通过 调用 
query2.bind(students) 绑 定 到 变量 students 中 的 对 象 上 (students 现在 表示 所 有 计算 机 科学 专业 
的 学 生 )。 第 二 个 占 位 符 ($2) 通过 第 二 个 调用 bind0 绑 定 到 变量 semester 提 供 的 String 对 象 
上 9S。 至 此 ， 查 询 已 全 部 指定 ， 并 且 可 以 使 用 execute() 方 法 执行 查询 。 作 为 执行 结果 的 Object 
在 赋予 courses 前 需要 转换 为 DSset 类 型 。 

得 到 了 想 要 的 课程 集合 后 ， 可 能 想 进一步 挑选 这 些 对 象 的 一 个 子 集 ， 检 查 具有 特定 性 质 
的 对 象 是 否 存在 ,或 者 使 用 类 似 游标 的 机 制 逐个 处 理 对 象 。 所 有 这 些 功 能 都 由 DCollection 接 
口 提供 ， 该 接口 是 接口 DSet 的 超 类 。 和 DSet 类 似 ，DCollection 也 是 OPDMG Java 绑 定 的 一 部 分 。 
我 们 给 出 DCollection 接 日 的 部 分 内 容 : 


public interface DCollection extends java.util.Collection { 
public DCollection query(String condition); 
public Object selectElement (String condition) ; 
public Boolean existsElement (String condition) ; 
public java.util.Iterator select (String condition); 


这 里 令 人 感 兴趣 的 方法 是 提供 了 功能 强大 的 生成 对 象 的 子 集合 的 query() ， 以 及 select() 。 
query() 方 法 类 似 于 关系 代数 中 的 选择 操作 符 ， 但 更 为 一 般 化 。 例 如 ， 上 述 方法 中 的 condition 
变量 可 以 包含 量词 forall 和 exits。DCollection 的 select() 方 法 生成 一 个 集合 ， 该 集合 由 以 参数 形 
式 提供 的 条 件 和 关于 该 集合 的 iterator 对 象 指定 。iterator 是 我 们 熟悉 的 游标 概念 的 具体 实现 。 
Java Iterator 接 口 定义 了 人 允许 宿主 语言 逐个 处 理 集合 中 对 象 的 方法 。 

回 到 我 们 的 程序 ， 我 们 可 以 获得 由 第 一 个 查询 计算 出 的 courses 集 合 ， 进一步 挑选 那些 少 
于 3 个 学 分 的 课程 : 


DSet seminars; 
seminars = (DSet) courses.query("this.Credits < 3") 


其 中 this 是 一 个 变量 ， 其 取 值 范围 是 queryO 所 作用 的 集合 的 所 有 元 素 。 同 样 假设 类 Course 拥 有 
属性 Credits。 当 然 ， 新 的 集合 semianrs 可 能 已 经 通过 一 个 OQL 查 询 直 接 计算 得 到 。 但 是 ， 如 果 
需要 计算 course 变 量 保存 的 集合 中 的 不 同 的 子 集 合 ， 则 首先 计算 较 大 的 集合 ， 然 后 使 用 
DCollection 接 口 进一步 查询 结果 的 效率 可 能 会 更 高 。 

由 接口 DCollection 指 定 的 其 他 方法 以 同样 的 方式 进行 工作 。 例 如 ，selectElement () 3% 
择 一 些 满足 条 件 的 集合 成 员 ， 这 些 条 件 作 为 参数 传递 。 方 法 exitsElement() 测 试 由 condition 条 
件 确 定 的 子 集 合 是 否 为 空 。 


O 注意 语句 query2.bind0 的 顺序 。 
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16.5 SQL: 1999 中 的 对 象 


SQL:1999 中 的 面向 对 象 扩展 已 经 经 过 了 许多 次 修订 。 最 终 的 结果 是 对 象 -关系 模型 的 一 
个 比较 简洁 ， 但 相当 有 限 的 版 本 。 这 是 一 次 困难 的 标准 化 处 理 ， 因 为 需要 保持 向 后 兼容 SQL- 
92，SQL-92 是 一 种 设计 时 根本 没有 考虑 对 象 概念 的 语言 。 

在 这 一 节 中 ， 我们 讨论 SQL:1999 新 的 对 象 -关系 扩充 。 但 是 ， 在 写作 本 书 时 ， 数 年 前 写 
作 的 许多 参考 书 都 已 经 过 时 ， 而 关于 新 标准 的 信息 并 不 容易 获得 。SQL:1999 对 象 模型 的 一 些 
内 容 的 较 好 的 介绍 在 [Fuh et al. 1999] 给 出 。 许 多 细节 可 以 从 [Gulutzan and Pelzer 1999] 得 到 。 

SQL:1999 数 据 库 包 含 一 个 关系 集合 。 每 一 个 关系 既是 一 个 元 组 集合 也 是 一 个 对 象 集合 。 
一 个 SQL:1999 对 象 (object) 是 一 个 二 元 组 (o,v)， 其 中 o 代 表 oid，v 代 表 SQL:1999 的 元 组 值 。 
SQL:1999 元 组 值 (tuple value) HERAA: Anwm]， 其 中 4…,4, 是 不 同 的 属性 名 ， 每 一 
个 vy 取 如 下 的 值 ( 使 用 16.3.1 节 介绍 的 术语 ): 

。 基 本 值 一 一 普通 SQL 的 基本 类 型 的 常量 ， 如 CHAR(18)、INTEGER、FLOAT 和 

BOOLEAN. 

。 引 用 值 一 一 对 象 Id。 

。 元 组 值 一 [hiv 和 Aso] 形 式 ， 其 中 A 是 不 同 的 属性 名 ， 每 一 个 v 是 一 个 值 。 

。 集 合 值 一 一 仅 包含 ARRAY 结 构 ， 这 里 就 不 再 介绍 了 。 曾 经 提出 的 SETOF 和 LISTOF 结 构 

没有 包含 在 标准 中 ,但 是 可 能 会 出 现在 以 后 的 版 本 中 。 特 别 是 ， 没 有 包含 集合 - 值 属性 

极 大 地 限制 了 SQL:1999 对 象 模型 的 有 效 性 ， 取 消 了 一 些 16.1 节 讨论 的 关于 对 象 的 优点 。 

作为 对 象 - 关 系 模 式 中 期 望 的 数据 模型 ，SQL:1999 中 的 每 一 个 对 象 的 顶层 值 是 一 个 元 组 。 
相反 ，ODMG 人 允许 顶层 为 任何 (类 型 的 ) 值 。 因 为 SQL:1999 不 支持 元 组 内 的 组 成 部 分 为 集合 
值 ， 所 以 对 于 多 数 实际 应 用 ， 元 组 构造 器 是 构造 复杂 值 的 唯一 途径 。 但 是 ， 元 组 可 以 供 套 在 
其 他 元 组 中 至 任意 深度 。 


16.5.1 行 类 型 


构造 用 于 属性 规格 说 明 中 的 元 组 类 型 的 最 简单 方法 是 用 ROW 类 型 构造 (type construct). 
例如 ， 可 以 用 如 下 方法 定义 关系 PERSON: 


CREATE TABLE PERSON ( 
Name CHAR(20), 
Address ROW(Number INTEGER, Street CHAR(20), ZIP CHAR(5)) ) 


我 们 使 用 通常 的 路 径 表达 式 来 引用 行 类 型 的 组 成 部 分 。 


SELECT P.Name: 
FROM PERSON P 
WHERE P.Address.ZIP = '11794' 


一 个 具有 行 类 型 的 表 可 以 通过 ROW 值 构造 器 (value constructor) 装 人 数据 ， 如 下 所 示 : 


INSERT INTO PERSON(Name, Address) 
VALUES ('John Doe', ROW(666, ‘Hollow Rd.', '66666')) 


更 新 表 用 行 类 型 也 非常 简单 。 
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UPDATE PERSON 
SET Address.ZIP = '12345' 
WHERE Address.ZIP = '66666' 


“John Doe 更 换 地 址 后 ， 可 以 用 如 下 方法 改变 整个 地 址 : 


UPDATE PERSON 

SET Address = ROW(21，'Main St.', '12345') 

WHERE Address = ROW(666, 'Hollow Rd.', '66666') 
AND Name = ‘John Doe' 


16.5.2 用 户 定义 类 型 


回想 16.3.3 节 中 讨论 过 ， 类 型 (CODM 中 ) 是 一 组 关于 数据 结构 化 的 规则 。 遵 循 这 些 规则 
的 对 象 集合 就 是 这 个 类 型 的 定义 域 。 一 个 类 有 多 个 模式 (包含 类 型 和 方法 签名 ) 和 一 个 外 延 ， 
外 延 是 类 型 的 定义 域 的 子 集 。 当 为 与 该 类 型 相关 的 方法 签名 添加 方法 体 时 ， 我 们 就 得 到 了 一 
个 抽象 数据 类 型 (abstract data type)。 在 SQL:1999 中 ， 抽 象 数据 类 型 称 为 用 户 定义 类 型 
(UDT)。 下 面 给 出 一 些 UDT 定 义 的 例子 : | 

CREATE TYPE PERSONTYPE AS ( 


Name CHAR(20), 
Address ROW(Number INTEGER, Street CHAR(20), ZIP CHAR(5)) ); 


Id INTEGER, 
Status CHAR(2)) 7 
METHOD award_degree() RETURNS BOOLEAN; 


CREATE METHOD award_degree() FOR STUDENTTYPE 

LANGUAGE C 

EXTERNAL NAME ‘file: /home/admin/award_degree' ; 

除了 现在 定义 的 是 类 型 而 不 是 表 之 外 ， 第 一 个 CREAT TYPE 司 句 类 似 于 前 面 的 表 
PERSON 的 定义 。 这 个 类 型 没有 任何 显 式 定义 的 方法 ， 但 是 很 快 将 会 看 到 DBMS 自 动 为 我 们 生 
成 许多 方法 。 

第 二 条 语句 更 有 趣 。 它 定义 STUDENTTYPE 作 为 PERSONTYPE 的 子 类 型 ， .PERSONTYPE 由 子 句 
UNDER 指 定 。 这 样 ， 它 就 继承 了 PERSONTYPE 的 属性 。 另 外 ，STUDENTTYPE 定 义 了 属于 自己 的 
属性 和 方法 award_degree()。 类 型 定义 仅 包含 方法 的 签名 。 实 际 的 定义 是 通过 使 用 CREATE 
METHOD 语 句 完成 的 (通过 FOR 子 名 与 SrTUDENTTYPE 相 关联 )。 该 语句 说 明 方 法 体 是 用 C 语 言 
编写 的 (所 以 DBMS 知 道 如 何 与 这 个 程序 链接 )， 并 且 告 诉 我 们 在 哪 可 以 找到 它 的 可 执行 体 。 
如 果 指 定 LANGUAGE SQL, 我 们 可 以 在 一 个 附带 的 BEGIN/ENDC 程 序 块 中 使 用 SQL/PSM 
(存储 过 程 语言 ( 见 第 10 章 )) 定义 方法 的 程序 代码 。 . 

用 户 定义 类 型 出 现在 两 种 主要 的 上 下 文中 。 首 先 ， 它 们 可 以 用 来 指定 表 中 属性 的 定义 域 ， 
就 像 基 本 类 型 ， 如 整数 型 和 字符 型 : 


CREATE TABLE TRANSCRIPT ( 
Student STUDENTTYPE, -- a previously defined UDT 
CrsCode CHAR(6), (16.12) 
Semester CHAR(6), 
Grade CHAR(1) ) 


CREATE TYPE STUDENTTYPE UNDER PERSONTYPE AS ( 
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这 里 使 用 CREATE TABLE 语 句 的 唯一 的 不 同 之 处 是 属性 可 以 拥有 复杂 类 型 (如 上 面 的 
STUDENTTYPE ) 。 

其 次 ，UDT 能 够 用 来 指定 整个 表 的 类 型 ， 这 可 以 通过 使 用 一 种 新 的 CREAT TABLE 语句 

现 ， 不 是 对 表 的 每 一 列 进 行 枚 举 。 这 意味 着 表 中 的 所 有 行 都 必须 具有 UDT 指 定 的 结构 。 例 

如 ， 可 以 定义 如 下 的 基于 前 面 定 义 的 UDT STUDENTTYPE 的 表 : 

CREATE TABLE STUDENT OF STUDENTTYPE; (16.13) 
通过 CREATE TABLE…OF 语句 创建 的 表 (如 上 所 示 ) 称 为 类 型 表 (typed table )。 类 型 表 的 
行 是 对 象 (object)， 下 面 将 进行 介绍 。 i 


16.5.3 对 象 


在 SQL:1999 中 生成 对 象 的 唯一 方法 是 在 类 型 表 中 插入 一 行 。 换 名 话说， 这 样 的 表 中 的 每 
一 行 都 被 作为 一 个 对 象 ， 拥 有 自己 的 oid。 表 自身 则 被 视 为 一 个 类 (如 CODM 中 所 定义 的 )， 
它 的 行 的 集合 对 应 于 类 的 外 延 。 

把 如 下 的 声明 与 (16.13) 对 比 一 下 是 有 启发 的 : 

CREATE TABLE STUDENT1 ( 

Name CHAR(20), 
Address ROW(Number INTEGER, Street CHAR(20) , ZIP CHAR(5) ) ， 


Id INTEGER, 
Status CHAR(2) ) 


注意 ， 其 中 STUDENT1 包 含 的 属性 与 STUDENT 完全 一 样 (名 字 和 类 型 也 一 样 )。 但 是 ， 
STUDENT 是 一 个 类 型 表 而 STUDENT1 不 是 ， 这 意味 着 SQL:1999 把 STUDENT 中 的 元 组 (而 不 是 
STUDENT1 中 的 元 组 ) 视 为 对 象 。 这 种 不 一 致 (甚至 可 以 称 为 矛盾 ) 的 两 种 创建 表 的 方法 是 为 
了 向 后 兼容 SQL-92。 还 要 注意 , 在 (16.12) 和 (16.13) 中 使 用 STUDENTTYPE 的 不 同 。 
STUDENTTYPE 的 实例 在 前 者 中 不 是 对 象 ， 而 在 后 者 中 则 是 对 象 。 

下 一 个 问题 是 如 何 获得 一 个 对 象 。 为 了 理解 这 个 问题 ， 让 我 们 回 到 (16.12) 的 TRANSCRIPT 
表 ， 考 虑 其 中 的 属性 student。 因 为 同一 学 生 可 能 参加 几 门 课程 ， 所 以 他 在 TRANSCRIPT 中 就 有 几 
条 记录 (元 组 )。 问 题 在 于 声明 

Student STUDENTTYPE 
的 意思 是 这 个 属性 返回 SrupENTTYPE 值 ， 而 不 是 引用 SrupENTTYPE 对 象 。 所 以 ， 同 一 学 生 的 信 
息 (姓名 、 地 址 等 ) 必须 重复 存储 在 该 生 在 TRANSCRIPT 中 的 每 一 条 记录 中 。 显 然 ， 这 同 我 们 
在 第 8 章 要 消除 的 宛 余 一 样 。SQL:1999 通 过 引入 显 式 的 引用 类 型 (reference type) 解决 了 这 个 
问题 ， 我 们 将 在 16.5.6 节 更 深入 地 讨论 这 个 问题 。 现 在 ， 我 们 只 要 记 住 引用 类 型 的 定义 域 是 
oid 集 合 就 行 了 。 为 了 引用 SQL:1999 中 的 对 象 ， 需 要 得 到 它 的 cid， 所 以 我 们 必须 考察 一 下 为 
此 提供 的 解决 机 制 。 

SQL:1999 标 准 说 明 每 一 个 类 型 表 (如 (16.3)) 都 有 一 个 自 引 用 列 (self-referencing 
column) 用 来 保存 元 组 的 oid。 当 元 组 创建 时 ，oid 会 自动 生成 。 但 是 ， 为 了 存 取保 存在 自 引用 
列 中 的 oid， 必 须 显 式 地 给 该 列 一 个 名 字 。 上 述 SrupENTTYPE 的 声明 中 没有 为 自 引 用 列 命名 ， 
所 以 在 该 表 中 无 法 引用 元 组 的 oid。 
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下 面 是 考虑 自 引 用 列 的 一 个 方法 : 


CREATE TABLE STUDENT2 OF STUDENTTYPE 
REF IS stud_oid; 


REF 子 句 给 出 自 引 用 列 一 个 显 式 的 名 字 stud_oid。( 注 意 ， 这 个 列 也 存在 于 (16.13) 中 ， 
但 是 是 隐藏 的 ， 所 以 不 能 被 引用 。) 在 大 多 数 的 使 用 方式 中 ，stud_oid 和 其 他 属性 一 样 。 特 别 
地 ， 可 以 把 它 用 于 查询 (SELECT 和 WHERE 子 句 都 可 以 ), 但 是 我 们 不 能 改变 它 的 值 ， 因 为 
oid 是 系统 赋予 的 ， 不 可 改变 。 

SQL:1999 通 过 区 分 对 象 和 它 的 引用 使 用 C 和 C++ 方法 。 这 种 区 分 在 ODMG 和 纯 面向 对 象 
语言 (如 Java) 中 是 不 存在 的 ， 并 被 领域 中 的 许多 研究 者 认为 是 一 个 倒退 。 


16.5.4 查询 用 户 定义 类 型 
查询 UDT 并 未 产生 任何 新 的 问题 。 我 们 只 要 使 用 路 径 表达 式 在 对 象 中 向 下 抽取 需要 的 信 
息 即 可 。 例 如 ， 


SELECT T.Student.Name, T.Grade f 
FROM TRANSCRIPT T (16.15) 
WHERE T.Student.Address.Street = 'Hollow Rd.' 


查询 TRANScRIPT 关 系 ， 并 返回 居住 在 Hollow Road 的 学 生 的 姓名 和 分 数 。 注 意 ，TStudent 返 回 
类 型 STUDENTTYPE 的 复杂 值 以 及 从 PERSONTYPE 继 承 允 许 我 们 存 取 为 它 定义 的 Name 和 Address- 
属性 。 
还 要 注意 ,尽管 STUDENT 和 STUDENT1 具 有 不 同 的 结构 ， 但 与 一 个 学 生 相 关 的 具体 查询 在 两 
种 情形 下 都 一 样 。 所 以 ， 

SELECT S.Address.Street 


FROM XS 
WHERE S.Id =.'111111111' 


返回 具有 Id 111111111 的 学 生 所 居住 的 街道 名 而 不 管 X 是 STUDENT 还 是 STUDENT1 。 


(16.14) 


16.5.5 更 新 用 户 定 义 类 型 


我 们 已 经 讨论 了 UDT 的 数据 定义 问题 ， 现 在 介绍 向 基于 UDT 的 关系 增添 数据 的 问题 。 我 
们 已 经 看 到 (在 16.5.1 节 中 ) 如 何 向 PERSON 表 中 插入 元 组 。 类 似 地 ， 我 们 可 以 使 用 同样 的 方 
法 向 表 STUDENT 和 STUDENT2 中 插入 元 组 。 这 些 关 系 包含 对 象 ( 以 及 额外 的 自 引 用 属性 ) 都 不 
是 问题 ， 因 为 oid 是 系统 创建 的 。 必 须 担 心 的 仅仅 是 那些 实际 属性 。 我 们 可 以 尝试 着 用 类 似 
INSERT 的 语句 向 关系 TRANSCRIPT 添 加 元 组 : 

INSERT INTO TRANSCRIPT(Student, Course, Semester, Grade) 

VALUES (7777, 'CS308', '2000', 'A') . 

但 是 ，VALUES 子 句 的 第 一 部 分 是 什么 呢 ? 为 了 回答 这 个 问题 ， 可 以 参阅 16.5.6 节 。 

UDT 被 封装 (encapsulated) 的 事实 ， 即 它 的 组 成 部 分 只 能 通过 类 型 提供 的 方法 进行 存 取 ， 
使 得 问题 变 得 更 加 复杂 。 虽 然 我 们 没有 为 STUDENTTYPBE 定 义 任 何方 法 ， 但 数据 库 为 我 们 进行 了 
定义 。 也 就 是 说 ， 对 每 一 个 属性 ， 系 统 提供 一 个 observer 方 法 (可 以 用 来 查询 属性 的 值 ) 和 一 
个 mutator 方 法 (用 来 改变 属性 的 值 )。observer 和 mutator 都 有 和 属性 同样 的 名 字 。 在 
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STUDENTTYPE 的 例子 中 , 系统 提供 如 下 observer 方 法 : 

“Id: 0~INTEGER。 这 个 方法 返回 一 个 整数 ， 并 且 同 所 有 observer 一 样 ， 它 不 接受 任何 

参数 2 。 

。Name 和 Status。 两 种 方法 都 有 type() CHAR(Iength)， 其 中 length 是 一 个 整数 。 

e Address: ()> ROW(INTEGER, CHAR((20), CHAR(S)). 
但 明显 ， 查 询 (16.15) 使 用 了 observer 方 法 Name 和 Address。 另 一 方面 ， 在 同一 查询 中 使 用 的 
表 TRANSCRIPT 的 Grade 属性 不 是 UDT 的 一 部 分 ， 所 以 它 没 有 observer 方 法 。 但 是 ， 这 种 区 别 是 
概念 上 的 而 不 是 语法 上 的 ， 因 为 从 语法 意义 上 说 ， 引 用 Grade 的 方法 与 引用 Name 的 方法 是 一 

Mutator 方 法 都 是 在 与 STUDENTTYPE 对 象 有 关 的 情形 下 被 调用 的 ， 并 返回 同样 的 对 象 。 但 
是 ， 它 们 拥有 不 同 的 参数 ， 返 回 的 对 象 在 状态 上 发 生 了 如 下 的 变化 : 

“Id: INTEGER > STUDENTTYPE。 这 个 方法 接受 一 个 整数 并 用 它 替 换 对 象 的 Id 值 。 换 句 话 

说 ，mutator 方 法 改变 了 学 生 的 Id 并 且 返 回 修改 后 的 对 象 。 

*Name: CHAR(20)— STUDENTTYPE。 这 个 方法 接受 一 个 字符 串 并 替换 学 生 对 象 中 的 Name . 

属性 的 值 。 它 返回 更 新 后 的 学 生 对 象 。Status 的 mutator 也 是 一 样 。 

e Address: ROW (INTEGER, CHAR (20), CHAR (5)) ~ STUDENTTYPE。 该 方法 接受 

一 个 表示 地 址 的 行 并 且 用 它 替 换 学 生 的 地 址 。 

注意 ，SQL 不 使 用 C++ 和 Java 的 pubic 和 private 描 述 符 来 控制 方法 的 存 取 。 相 反 ， 它 使 用 
EXECUTE 的 权限 以 及 4.3 节 介绍 的 常 用 的 GRANTREYOKE 机 制 I 来 控制 存 取 。 

现在 准备 第 一 次 向 UDT 中 插入 元 组 。 


INSERT INTO TRANSCRIPT(Student, Course, Semester, Grade) 
VALUES (NEW StudentType() 
. Id (666666666) 
.Status('G5') 
-Name('Vlad Dracula’) (16.16) 
. Address (ROW(666, 'Transylvania Ave.','66666')), 
'HIS666', 
'F1462', 
'D') 


这 里 应 该 注意 两 件 事 。 在 插入 的 元 组 的 第 一 部 分 通过 调用 StudentType0) 生 成 了 一 个 空白 
学 生 对 象 ， 其 中 StudentType() 是 DBMS 为 每 一 个 UDT 生 成 的 构造 器 。 然 后 ， 新 生成 的 对 象 上 
的 mutator 方 法 被 逐个 地 调用 以 便 进行 数据 填充 。。 

如 果 要 更 改 学 生 的 地 址 、 姓 名 和 课程 的 分 数 ， 可 以 用 下 面 的 更 新 语句 : 


UPDATE TRANSCRIPT 
SET Student = Student 
.Address (ROW(21, 'Main St.','12345')) 
-Name('John Smith'), 
Grade = 'A' 
WHERE Student.Id = 666666666 
AND CrsCode = 'HIS666' AND Semester = 'F1462' 


日 符号 O 表示 该 方法 无 参数 。 
合 注意 ， 上 面 的 语法 只 是 NEW StudentType(.Id(… …: ).Status(……… ).Name(……… ).Address(………) 的 缩 进 的 
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我 们 使 用 DBMS 生 成 的 SrupENTTYPE 的 mutator 国 数 来 更 新 学 生 对 象 的 值 。 首 先 ， 用 Address(O) 
mutator 更 新 地 址 ， 然 后 应 用 Name () mutator。 

你 一 定 已 经 注意 到 向 涉及 UDT 的 关系 中 插入 新 元 组 是 相当 繁琐 的 。 但 是 ， 把 方法 关联 到 
复杂 数据 类 型 的 功能 可 以 在 某 种 程度 上 使 上 述 问题 得 到 简化 。 也 就 是 说 ,我们 可 以 定义 一 个 
只 接受 标量 值 的 特殊 的 构造 器 方法 。 这 样 ， 一 个 复杂 对 象 可 以 通过 调用 一 次 该 构造 器 来 产生 。 

我 们 用 SQL 存 储 过 程 的 语言 来 解释 上 述 想 法 。 首 先 需 要 把 下 面 的 声明 加 入 到 
STUDENTTYPEe 的 早期 定义 中 : 


METHOD StudentConstr(name CHAR(20), id INTEGER, 
streetNumber INTEGER, 
streetName CHAR(20), 
zip CHAR(5), status CHAR(2)) 

RETURNS STUDENTTYPE; 


然后 ， 定 义 方法 主体 ， 方 法 如 下 : 


CREATE METHOD StudentConstr (name CHAR(20), id INTEGER, 
streetNumber INTEGER, 
streetName CHAR(20), 
zip CHAR(5), status CHAR(2)) 

RETURNS STUDENTTYPE 

LANGUAGE SQL 

BEGIN 
RETURN NEW STUDENTTYPE() 
. Name (name) 
.Id(id) 
. Status (status) 
. Address (ROW(streetNumber ,streetName,zip)); 
END; 


有 了 新 的 构造 器 ， 向 对 应 于 (16.16) 的 TRANSCRIPT 关 系 中 插 人 新 元 组 就 变 得 不 太 繁 琐 了 。 


INSERT INTO TRANSCRIPT(Student, Course, Semester, Grade) 
VALUES (StudentConstr('Vlad Dracula', 666666666, 666, 
‘Transylvania Ave.', '66666', 'G5'), 
'HIS666', 
'F1i462', 
'D ' ) 


16.5.6 引用 类 型 


在 关系 TRANSCRIPT 的 模式 (16.12) 中 ， 属 性 Student 具 有 STUDENTTYPE 类 型 。16.5.3 节 解释 
过 ， 这 阻碍 了 学 生 对 象 的 共享 ， 因 为 每 个 学 生 的 记录 都 物理 存储 在 对 应 的 脚本 记录 中 。 为 了 
能 够 共享 对 象 ，SQL:1999 使 用 引用 数据 类 型 (reference data type)。 引 用 是 一 个 oid ， 
REF(udt-xyz) 形 式 的 类 型 的 域 包 含 udi-xyz 类 型 对 象 的 所 有 的 oid。 可 以 用 以 下 方式 重 写 (16.12) 
的 TRANSCRIPT 的 定义 : 


CREATE TABLE TRANSCRIPT1 ( 
Student REF(STUDENTTYPE) SCOPE STUDENT2, 
CrsCode CHAR(6), ( 16.17) 
Semester CHAR(6), 
Grade CHAR(1) ) 


O 类似 于 属性 ， 方 法 可 以 用 SQL 中 的 ALTER 语 句 进行 添加 。 
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我 们 需要 对 Student 属 性 做 更 多 的 解释 。 首 先 ， 类 型 REF:(STUDENTTYPE) 的 意思 是 Student 
的 值 必须 是 一 个 类 型 为 STUDENTTYPE 的 对 象 的 oid。 然而 ,我 们 可 以 创建 许多 不 同类 型 的 表 并 
把 它们 与 STUDENTTYPE 相 关联 ， 每 一 张 表 都 可 以 包含 各 种 类 型 的 学 生 。 我 们 可 能 不 希望 
Student 指 向 任意 的 学 生 。 相 反 ， 我 们 需要 某 种 参照 完整 性 来 保证 这 个 属性 指向 特定 表 所 描述 
的 学 生 。SCOPE 子 句 恰 好 起 到 了 这 样 的 作用 : 限定 Student 的 值 不 是 任意 一 个 STUDENTTYPE 类 
型 对 象 的 对 象 号 ， 而 是 属于 表 STUDENT2。 中 一 个 已 存在 的 对 象 。 注 意 ，( 16.14) 中 定义 
STUDENT 时 ， 选 择 STUpENT2 不 是 偶然 的 。 

新 的 特征 通常 带 来 特征 的 混淆 。 对 于 (16.17) 中 定义 的 表 TRANSCIPT1，(16.15) 中 的 查 
询 可 以 写 为 下 面 的 形式 。 这 个 查询 中 包含 一 个 引用 类 型 的 属性 一 STUDENT: 

SELECT T.Student->Name, T.Grade 


FROM TRANSCRIPT1 T 
WHERE T.Student->Address.Street = ‘Hollow Rd.' 


注意 ， 我 们 使 用 ~ 来 指向 STUDENTTYPE 对 象 的 属性 。 这 是 因为 T.Student 返 回 的 是 一 个 学 生 对 
象 的 oid， 而 不 是 对 象 本 身 。 由 于 历史 原因 ， 用 “.” 和 用 “一 ”表示 的 引用 在 C/C++ 中 是 不 
同 的 。 而 在 面向 对 象 语言 中 没有 必要 对 这 两 者 进行 区 别 ， 所 以 在 OQL 和 Java 中 不 存在 两 种 不 
同 的 符号 9。 

ECHC, 选择 “.” 或 “一 ”的 原则 是 一 样 的 。 如 果 一 个 属性 是 引用 类 型 ， 则 在 路 径 
表达 式 中 使 用 “一 ”; 如 果 是 对 象 类 型 ， 则 使 用 “.”。 在 我 们 的 例子 中 ，T. Student 有 一 个 引 
用 类 型 REF(STUDENTTYPE)， 所 以 用 T. Student > Address 来 指向 student object 里 面 。 相 反 ， 查 询 
(16.15) 使 用 T. Student.Address ， 因 为 这 里 T.Student 的 类 型 是 STUDENTTYPE， 它 不 是 一 个 引用 
类 型 。 

男 外 一 个 重要 的 问题 是 怎样 填充 表 TRANSCRIPT1。 在 16.5.5 节 中 我 们 看 到 了 怎样 把 元 组 插 
入 到 复杂 类 型 中 的 例子 。 但 是 ， 那 些 例子 并 不 处 理 对 象 引用 。 为 了 向 TRANSCRIPT1 中 插入 一 个 
元 组 ， 必 须 找 到 一 个 方法 来 存 取 Student 对 象 的 oid， 然 后 把 它们 赋 给 Student 属 性 。 这 就 是 第 
16.5.3 节 中 所 说 的 自 引用 列 。 回 想 一 下 该 节 定 义 的 表 STUpENT2， 它 有 一 个 由 子 句 REF IS® 
的 自 引 用 列 stud_oid。 同 样 ， 在 (16.13) 中 定义 的 表 STUpENT 与 STUDENT2 有 相同 的 类 型 ， 只 是 
它 的 自 引 用 列 是 隐藏 的 〈 因 为 我 们 设 有 给 它 命名 ) 。 这 样 就 没 办 法 得 到 STUDENT 表 中 的 元 组 的 
oid， 并 把 它 赋 给 TRANSCRIPT1 表 中 的 STUDENT 属 性 了 。 正 是 因为 这 个 原因 ， 在 定义 TRANSCRIPT1 
时 ， 应 使 用 STUDENT2 而 不 是 STUDENT 。 l 

假设 STupENT2 中 的 Id 属性 是 一 个 键 ， 我 们 能 够 向 TRANSCRIPT1 中 插入 一 个 student， 方 法 
如 下 : . 


INSERT INTO TRANSCRIPT1 (Student, ‘Course, Semester, Grade) 
SELECT S.stud_oid, 'HIS666' ， 'F1462', 'D' 

FROM STUDENT2 S 

WHERE S.Id = '666666666' 


O 为 了 使 得 这 些 要 求 保持 一 致 ，SCOPE 中 提 到 的 关系 必须 和 REF 中 提 到 的 类 型 相关 联 ， 就 像 SrupENT2 通 过 
CREATE TABLE...OF 语 名 与 STUDENTTYPE 相 关联 一 样 。 

© 0OQL 中 人 允许 使 用 “~ ”， 但 这 只 是 用 点 表示 的 的 另 一 种 写法 。 

© 注意 ，stud_oid 不 使 用 属性 It， 它 是 SrupENTTYPE 的 一 个 常规 属性 ， 该 属性 是 由 程序 员 显 式 赋 值 的 。 
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注意 ， 我 们 用 一 个 SELECT 语句 来 检索 所 有 想 要 的 Student 对 象 的 oid。 这 个 oid 成 为 Student 属 性 
的 值 。 而 属性 Course、Semester 和 Grade 的 值 是 直接 添加 到 目标 列表 中 去 的 。 


16.5.7 集合 类 型 


最 有 用 的 集合 类 型 是 set 和 list， 目 前 已 经 被 标准 忽略 。 如 果 有 了 这 些 类 型 ， 数 据 建 模 会 变 
得 更 加 自然 ,更 接近 于 ODMG 中 的 各 种 可 能 情况 。 例 如 ， 可 以 使 用 Enrolled 属 性 扩展 
STUDENTTYPE 而 不 必 重 新 创建 一 个 新 的 TRANSCRIPTS 表 ， 方 法 如 下 9S: 


CREATE TYPE STUDENTTYPE UNDER PERSONTYPE AS ( 
Id INTEGER, 
Status CHAR(2) 
Enrolled SETOF(REF(CouRSETYPE)) SCOPE COURSE) 
METHOD StudentConstr (name CHAR(20), id INTEGER, 
streetNumber INTEGER, 
streetName CHAR(20), 
zip CHAR(5), status CHAR(2)) 
RETURNS STUDENTTYPE 
METHOD award_degree() RETURNS BOOLEAN; 


在 这 个 例子 中 ，Enrolled 属 性 的 值 必 须 是 关系 CouRsSE 中 元 组 的 一 组 oid。 
通过 使 用 上 面 的 collection 类 型 - set， 可 以 写 出 一 种 新 的 查询 。 下 面 的 查询 列 出 每 一 个 学 
生 的 Id、 居 住 的 街道 和 所 选课 程 。 


SELECT S.Id, S.Address.Name, C.Name 
FROM STUDENT S, COURSE C 
WHERE C.CrsCode IN 

(SELECT E -> CrsCode 

FROM S.Enrolled E) 


这 里 ，WHERE 子 句 测试 SrupENT 和 CouRsE 的 笛 卡 儿 积 的 每 一 个 元 素 。 条 件 使 用 一 个 嵌 套 的 
SELECT 语句 来 产生 笛 卡 儿 积 中 某 一 行 所 描述 的 学 生 所 学 的 课程 代码 的 集合 。 

优 套 SELECT 语句 的 FROM 子 句 展示 了 一 个 新 的 特征 。 变 量 E 的 范围 是 由 路 径 表达 式 
S.Enrolled 给 定 的 一 个 集合 。 这 个 集合 里 面 每 一 个 元 素 都 是 对 学 生 S 所 参与 的 一 门 课 所 对 应 的 
CouRsE 对 象 的 引用 。 这 和 SQL-92 中 利用 FROM 子 句 使 用 查询 结果 是 类 似 的 ， 只 是 这 里 使 用 路 
径 表达 式 ， 而 不 是 查询 来 返回 对 象 引用 的 集合 。 

因为 E 的 范围 是 对 象 引 用 ， 所 以 必须 通过 “~ ”操作 符 来 访问 每 一 个 对 象 的 属性 ， 它 将 间 
接 引用 E 并 产生 CouRsE 中 的 一 个 特定 对 象 。 


16.6 公共 对 象 请 求 代理 体系 结构 


CORBA 是 为 客户 端 访问 驻 留 在 服务 器 上 的 对 象 的 环境 所 设计 。 客 户 端 能 够 获得 这 样 的 服 
务 的 一 种 方法 是 利用 远程 过 程 调用 (Remote Procedure Call, RPC) [Birrell and Nelson 1984], 
22.4.1 节 将 对 RPC 进 行 讨论 。 客 户 端 进程 执行 过 程 调用 ， 使 过 程 在 服务 器 进程 (可 能 是 另 一 台 
机 器 ) 中 被 执行 。 . 

对 象 管理 组 (Object Management Group, OMG) 提出 了 一 个 新 的 中 间 件 标准 : 公共 对 象 


O 为 了 使 这 个 例子 更 加 简单 ， 我 们 在 新 的 设计 中 忽略 成 绩 存储 在 哪里 的 问题 。 
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请 求 代理 体系 结构 (Common Object Request Broker Architecture, CORBA). RPC, 
CORBA 能 够 让 客户 端 访问 驻 留 在 服务 器 上 的 对 象 ， 而 且 它 更 加 灵活 ， 更 加 一 般 化 。 不 过 ， 它 
并 不 是 一 个 RPC 的 替代 品 或 类 似 的 机 制 。 事 实 上 ，CORBA 通 常 是 在 RPC 之 上 实现 的 。 

CORBA 与 RPC 的 另 一 个 相似 之 处 是 它 提 供 分 布 式 计算 资源 的 位 置 透明 性 (location 
transparency)。 这 意味 着 客户 端 访 问 资源 时 是 与 位 置 无 关 的 ， 资 源 位 置 的 变化 不 会 影响 客户 
端 。 在 RPC 中 ， 远 程 资 源 被 指定 成 不 相关 的 过 程 的 集合 ， 而 CORBA 把 资源 看 成 是 包含 一 组 相 
关 操 作 的 对 象 。 它 同时 为 客户 端 应 用 提供 发 现 和 使 用 远程 服务 的 机 制 ， 即 使 这 些 服务 在 编写 
应 用 时 还 不 存在 或 没有 设计 出 来 。 

在 CORBA 中 包含 一 个 叫做 CORBAservices 的 层 ， 它 为 提供 持久 性 、 查 询 和 事务 服务 提供 
基础 设施 。 持 久 性 、 查 询 和 事务 服务 都 是 本 节 所 要 讨论 的 重点 。CORBA 已 成 为 制造 、 电 子 商 
务 、 银 行 和 医疗 等 领域 的 各 种 应 用 框架 的 平台 。 这 些 框架 是 CORBAfacilities 层 的 一 部 分 。 本 
节 不 讨论 这 一 层 ， 详 细 信 息 可 见 [Pope 1998]。 


16.6.1 CORBA 基 础 


每 一 个 服务 器 使 用 接口 定义 语言 (Interface Description Language, IDL) 来 定义 驻 留 在 它 
上 面 的 对 象 的 接口 。IDL 是 ODMG 的 对 象 定义 语言 (Objéct Definition Language, ODL, H 
16.4.17) 的 一 个 子 集 。 和 ODL 一 样 ， IDL 用 于 指定 类 和 方法 的 签名 。 然 而 ，IDL 类 没有 扩展 ， 
它们 被 称 为 “接口 ”( 和 ODL 术 语 保 持 一 致 )。IDL 里 也 没有 约束 和 和 集合 类 型 (比如 Set)， 而 
ODL 中 则 有 存在 。 E 

为 了 解释 这 个 概念 ， 考 虑 一 个 公用 图 书馆 的 服务 器 ， 它 提供 对 图 书馆 藏书 进行 检索 的 一 
个 接口 。 客 户 端 应 用 可 以 使 用 这 些 搜索 机 人 制 来 为 用 户 提供 服务 。 

. /* File: Library.idl */ 
module Library { 
interface myTownLibrary { 


string searchByKeywords(in string keywords) ; 
string searchByAuthorTitle(in string author, in string title); 


} 

接口 通常 根据 用 途 组 成 各 个 模块 。 使 用 模块 的 一 个 极 大 的 好 处 是 它 能 避免 因为 开发 接口 
的 组 织 或 部 门 不 同 所 造成 的 命名 冲突 。 因 为 模块 名 称 总 是 作为 方法 名 称 的 前 经 。 这 样 ， 客 户 
端 对 searchByKeywords 0 方法 的 引用 可 以 写 做 : 

Library_myTownLibrary_searchByKeywords(...) 

客户 端 应 用 的 请 求 是 怎样 导致 服务 器 代码 执行 的 呢 ? 这 是 通过 对 象 请 求 代理 完成 的 ， 下 
面 将 进行 详细 讨论 。 7 

1. 对 象 请 求 代理 

CORBA 体 系 结构 中 的 一 个 新 的 组 件 是 对 象 请 求 代理 (Object Request Broker, ORB), 它 
处 于 客户 端 和 各 个 服务 器 之 间 ， 如 图 16-3 所 示 。 当 客户 端 根 据 IDL 的 描述 执行 一 个 方法 调用 ， 
调用 就 会 传 给 ORB。ORB 负 责 定位 包含 那个 对 象 的 服务 器 ， 然 后 在 客户 端 方法 调用 和 服务 器 
类 定义 所 需 的 方法 调用 之 间 做 必要 的 转化 。 也 就 是 说 ，ORB 将 IDL 语 言 映射 到 实现 对 象 的 语 
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a 


。 CORBA 标 准 定义 IDL 可 以 映射 到 C、€ 上 村 Java, Cobol, Smalltalk#Ada. 


object_reference; ` 
operation name; 
argument_descriptors; ; 
exception handling info; ; 
context object; f 





图 16-3- CORBA 体系 结构 


远程 调用 服务 器 对 象 的 详细 的 过 程 如 下 所 示 。。 在 部 署 服务 器 的 时 候 ，IDL 定 义 、 
Library.idl 被 CORBA 厂 商 提 供 的 IDL 编 译 器 所 编译 。 编 译 后 产生 一 对 文件 : Library-stubs.c 和 
Library-skeleton.c。 而 且 ， 接 口 定义 的 方法 签名 以 及 相关 的 IDL 信 息 存储 在 接口 仓库 
(interface repository) 中 。 

文件 Library-skeleton.c 中 包含 一 个 服务 器 框架 。 这 部 分 代码 将 与 操作 系统 和 语言 无 关 的 客 
户 端 请 求 映射 成 具体 的 (操作 系统 、 语 言 相关 ) 对 图 书馆 服务 器 上 的 searchByKeywords() 和 
searchByAuthorTitle() 方法 的 调用 。 框 架 在 服务 器 部 署 前 就 被 编译 并 与 服务 器 链接 。 当 服务 器 
启动 时 ， 它 将 在 对 象 适配器 (object adapter) 中 注册 自己 ， 对 象 适 配器 是 驻 留 在 服务 器 上 的 
ORB 的 一 部 分 。 通 过 注册 ， 服 务 器 通知 ORB， 它 可 以 用 接口 仓库 中 所 描述 的 特定 接口 中 的 特 
定 方法 处 理 调 用 。 。 有 意思 的 是 ， 可 以 注册 不 同 的 实现 来 处 理 同 一 个 方法 调用 (在 同一 个 接 
口中 )， 由 对 象 适配器 来 选择 一 个 特定 的 实现 。 例 如 ， 如 果 图 书馆 的 目录 是 分 布 式 的 ， 对 象 适 
配器 通过 使 用 一 个 搜索 目录 的 本 地 高 速 缓存 副本 的 实现 来 满足 对 图 书馆 顾客 的 请 求 。 同 样 ， 
图 书馆 工作 人 员 的 查询 也 可 以 用 执行 分 布 式 搜索 的 实现 来 完成 。 对 象 适配器 可 以 根据 查询 中 
所 包含 的 客户 端的 上 下 文 对 象 (context object) 来 决定 使 用 哪 二 种 实现 8?。ORB 维 护 实现 仓库 
(implementation repository) 来 跟踪 服务 器 上 不 同方 法 的 可 用 实现 。 


O 我 们 描述 整体 的 过 程 。 某 些 方面 可 能 与 特定 的 CORBA 实 现 有 关 。 

O 原则 上 讲 ， 同 一 个 接口 的 不 同方 法 可 以 由 不 同 的 服务 器 处 理 。 相 似 的 ， 不 同 接口 的 方法 也 可 以 由 同一 个 服 
务 器 来 执行 。 

© CORBA 定 义 一 个 接口 Context 来 提供 为 任意 性 质 设 置 名 / 值 对 的 方法 。Context 对 象 包 含 客户 端 所 定义 的 所 
有 的 名 / 值 对 。 服 务 器 可 以 使 用 Context 接 口 来 检查 Context 对 象 的 可 用 属性 ， 并 进行 相应 的 操作 。 这 样 ， 客 
户 端 就 可 以 使 用 Context 对 象 来 给 服务 器 提供 有 关 请 求 的 元 信息 。 
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在 客户 端 ， 可 以 通过 以 下 几 种 方式 进行 方法 调用 。 如 果 客 户 端 应 用 知道 怎样 调用 服务 器 
方法 〈 例 如， 知道 方法 的 名 称 及 参数 的 类 型 ) ， 就 可 以 使 用 静态 调用 (static invocation) 来 编 
译 客户 端 并 和 客户 端 桩 (client stub) 进行 链接 。 在 我 们 的 例子 中 ， 客 户 端 桩 保存 在 IDL 编 译 
器 所 产生 的 文件 Library-stubs.c 中 。 利 用 静态 调用 ， 客 户 端 调用 远程 方法 时 就 像 调用 本 地 子 例 
程 一 样 。 桩 里 包含 把 这 个 调用 (内 部 格式 可 能 是 与 操作 系统 和 语言 相关 的 ) 转换 成 与 操作 系 
统 和 语言 无 关 的 远程 方法 调用 请 求 ， 然 后 这 个 请 求 在 网 络 上 通过 ORB 进 行 传送 。 然 后 ， 服 务 
器 上 的 框架 再 把 请 求 转换 为 与 操作 系统 和 语言 相关 的 对 服务 器 过 程 的 调用 。 这 里 重要 的 一 点 
是 ， 服 务 器 和 客户 端 可 以 使 用 不 同 的 语言 ， 并 且 在 不 同 的 操作 系统 下 运行 。 

将 方法 调用 转换 为 机 器 无 关 的 形式 主要 涉及 一 个 排列 参数 (marshaing the argument) 的 
过 程 。 这 是 因为 不 同 的 机 器 和 语言 通常 对 数据 进行 不 同 的 编码 。 例 如 ， 有 些 机 器 采用 big- 
endian 的 表示 ， 有 些 是 little-endian; 有 些 机 器 使 用 32 位 的 字 ， 有 些 使 用 64 位 的 字 ; 有 些 计 算 
机 语言 用 空 字 节 来 结束 字符 串 ， 有 些 则 不 是 。 

如 你 所 见 ， 发 送 数据 “as is” 很 可 能 使 得 在 接收 的 计算 机 上 不 可 使 用 。 在 CORBA 中 ， 客 
户 端 和 服务 器 通过 一 个 提 手 协议 来 进行 数据 编码 和 解码 。 在 某 些 情况 下 ， 一 个 方法 调用 请 求 
包含 一 个 用 于 每 一 个 参数 (或 方法 结果 ) 的 解码 器 ， 其 中 包括 了 参数 的 值 以 及 参数 的 类 型 和 
长 度 。 而且， 所 有 的 这 些 数据 项 都 是 以 与 机 器 无 关 的 网 络 格式 编码 的 。 然 而 ， 必 须 清楚 的 是 ， 
程序 员 并 不 需要 亲自 解决 这 个 转换 问题 。 相 反 ， 它 是 由 桩 调用 (间接 ) 的 CORBA 库 例 程 来 完 
成 的 。CORBA 中 的 一 个 方法 调用 请 求 的 整个 结构 如 图 16-3 所 示 。 

在 有 些 情况 下 ， 客 户 端 不 知道 怎样 调用 服务 器 上 的 方法 。 这 乍 听 起 来 好 像 不 可 能 ; 然而 
有 很 多 实际 发 生 的 例子 ， 或 许 还 很 有 用 。 让 我 们 重新 考虑 那个 图 书馆 搜索 应 用 ， 不 过 这 次 假 
设 它 要 给 用 户 提供 对 不 同 的 图 书馆 的 不 同 目录 进行 搜索 的 能 力 。 一 种 可 能 的 情况 是 强制 所 有 
的 图 书馆 服务 器 使 用 同样 的 接口 myTownLibrary， 但 这 显然 是 不 现实 的 ， 因 为 不 同 的 图 书馆 可 
能 有 不 同 的 遗留 系统 ， 而 且 变 更 需要 的 花费 很 大 。 而 且 ， 不 同 的 图 书馆 可 能 提供 不 同 的 搜索 
能 力 ， 例 如 ， 有 些 图 书馆 可 能 会 提供 利用 模式 及 通配符 进行 搜索 的 功能 。 

如 果 检 索 涉 及 的 图 书馆 一 直 保持 不 变 ， 我 们 可 以 把 不 同 的 接口 编码 在 客户 端 应 用 里 ， 从 
而 解决 这 个 问题 。 但 是 ， 我 们 希望 我 们 的 应 用 能 够 允许 新 的 图 书馆 加 入 或 已 有 的 图 书馆 退出 ， 
而 且 新 加 入 的 图 书馆 也 能 被 我 们 的 应 用 正常 搜索 。 例 如 ， 如 过 yourTownLibrary 加 入 了 系统 ， 
我 们 可 以 将 Library IDL 模块 改写 为 : 


/* File: Library.idl */ 
module Library { 
interface myTownLibrary { 
string searchByKeywords(in string keywords) ; 
string searchByAuthorTitle(in string author, in string title); 
} 
interface yourTownLibrary { : 
void searchByTitle(in string title, out string result); 
void searchByWildcard(in string wildcard, out string result); 
} 
} 


在 上 面 的 yourTownLibrary 接 口中 ， 不 仅仅 是 方法 名 称 和 调用 顺序 不 同 ， 结 果 也 是 以 输出 参数 
而 不 是 以 函数 结果 的 形式 返回 的 。 在 编译 完 Library.idl 并 且 将 框架 与 yourTownLibrary 的 服务 器 





H1O¥ HERH 393 


链接 后 ， 就 能 让 客户 端 搜索 应 用 搜索 两 个 图 书馆 了 。 

为 了 达到 这 些 目标 ， 我 们 将 客户 端 应 用 设计 成 让 用 户 填写 一 个 基本 信息 的 表格 。 表 格 中 
包含 书籍 的 SBN、 作 者 、 关 键 词 及 通配符 。 然 后 客户 端 应 用 根据 参数 名 分 析 所 有 在 Library .idl 
中 定义 的 接口 ， 创 建 适合 服务 器 的 调用 。 例 如 ， 如 果 用 户 填 人 了 作者 、 关 键 词 、 通 配 符 等 信 
息 ， 客 户 端 应 用 就 可 以 选择 接口 myTownLibrary 中 的 searchByKeywords () 和 接口 
yourTownLibrary 中 的 searchBywildcard()。 如 果 用 户 输 入 了 一 个 标题 和 一 个 通配符 ， 可 能 就 不 
会 选择 myTownLibrary (因为 它 没有 正确 的 参数 )， 而 是 选择 yourTownLibrary 中 的 
searchByTitle ()。 为 了 实现 这 个 调用 策略 ， 我 们 可 以 要 求 成 员 数 据 库 在 写 接口 的 IDL 描 述 时 从 
一 个 固定 的 词汇 表 里 选 择 参数 名 。 这 个 要 求 不 一 定 会 给 遗留 数据 库 带 来 变化 ， 而 仅仅 是 在 接 
口 设计 中 加 入 一 些 原则 。 

怎样 实现 这 个 灵活 的 方法 调用 策略 呢 ? 这 时 就 要 引入 接口 仓库 。 客 户 端 应 用 可 以 使 用 
CORBA 提 供 的 一 个 特殊 的 动态 调用 API (dynamic invocation API) 而 不 是 桩 去 查询 接口 仓库 。 
这 个 API 充 许 应 用 决定 模块 Library 中 的 所 有 接口 ， 每 一 个 接口 中 定义 的 方法 ， 每 一 个 方法 的 参 
数 名 及 类 型 以 及 方法 的 返回 值 的 类 型 。 根 据 参 数 名 ， 搜 索 应 用 可 以 决定 应 该 调用 哪些 方法 及 提 
供 哪些 参数 。 它 通过 使 用 API 调 用 CORBA_Object_create_request() 生 成 适当 的 请 求 对 象 。 请 求 
对 象 包含 被 调用 的 方法 名 ， 其 参数 的 名 字 和 类 型 ， 以 及 返回 结果 的 类 型 。 一 个 完全 创建 的 请 求 
可 以 作为 一 个 CORBA API 子 例 程 CORBA_Request_invokeO 的 参数 ， 来 执行 对 服务 器 上 方法 的 
实际 调用 。 这 个 请 求 采用 与 机 器 相关 的 格式 ， 并 且 由 上 面 的 API 子 例 程 将 请 求 通过 网 络 传输 到 
ORB 的 服务 器 端 。 然 后 ，ORB 用 服务 器 skeleton 将 请 求 转换 为 对 服务 器 方法 的 具体 调用 。 

值得 注意 的 是 ， 静 态 调用 实际 上 执行 的 是 为 ORB 创 建 请 求 的 动作 。 然 而 ， 因 为 对 服务 器 
方法 的 调用 序列 是 预先 知道 的 ， 所 以 需要 的 操作 序列 是 由 IDL 编 译 省 自动 生成 的 ， 并 组 成 了 客 
户 端 桩 的 核心 部 分 。 

在 对 客户 端 方法 调用 的 讨论 中 ， 忽 略 了 一 点 ， 即 客户 端 要 求 服务 器 执行 操作 的 实际 对 象 。 
客户 端 给 ORB 的 请 求 中 包含 一 个 请 求 对 象 的 对 象 引 用 (object reference )。 客 户 端 是 怎样 得 到 
这 个 引用 的 呢 ? 

一 种 方法 是 让 客户 端 和 服务 器 的 设计 者 遵循 某 些 协议 。 例 如 ， 服 务 器 可 能 会 将 对 象 引用 
作为 字符 串 在 网 络 上 经 常 访问 的 地 点 发 布 。 在 我 们 的 例子 中 ， 对 参加 对 象 的 所 有 引用 都 可 以 
在 网 络 上 的 某 些 协议 文档 里 发 布 。 然 后 可 以 通过 API 调 用 CORBA_ORB_string_to_object 0) 把 
这 些 字 符 串 格式 的 引用 转换 为 CORBA 中 使 用 的 内 部 二 进 制 格式 。 

一 个 更 加 方便 的 获得 对 象 引 用 的 方法 是 使 用 命名 服务 ， 我 们 将 在 下 一 节 中 进行 讨论 。 

2. CORBA 中 的 互 操作 性 

如 果 世 界 上 只 有 一 个 ORB 对 象 ， 那 么 每 一 个 对 象 都 可 以 和 其 他 对 象 进行 交谈 。 然 而 事实 
情况 是 ， 不 同 的 组 织 和 公司 喜欢 部 署 自 己 的 ORB ， 其 中 绑 定 了 实现 它们 的 业务 过 程 的 对 象 。 
如 果 一 组 企业 在 一 个 项 目 中 进行 合作 ， 它 们 必须 为 那个 项 目 重新 部 署 一 个 ORB 对 象 。 于 是 就 
存在 怎样 和 不 同 的 ORB 所 控制 的 对 象 进行 通信 和 的 问题 。 我 们 知道 ， 一 个 ORB 对 象 可 以 向 自己 
控制 的 对 象 传递 请 求 ， 然 而 ， 如 果 一 个 对 象 属于 另外 一 个 ORB ， 就 需要 利用 协议 来 传送 请 求 。 

幸运 的 是 ，CORBA 对 这 个 问题 有 一 般 性 的 回答 一 一 通用 ORB 间 协议 (General Inter-ORB 
Protocol，GIOP) 。GIOP 实 质 上 是 一 个 特殊 格式 的 消息 ， 它 使 得 一 个 ORB 可 以 向 另 一 个 ORB 
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所 控制 的 对 象 发 送 请 求 ， 并 接受 回答 。 因 为 这 些 消息 必须 在 实际 的 网 络 中 进行 传输 ， 所 以 必 


须 把 它们 映射 为 已 有 网 络 中 的 消息 格式 。IIOP (Internet inter-ORB Protocol， 因 特 网 ORB 间 协 
i) 就 是 这 样 一 个 协议 ， 它 指定 怎样 将 GIOP 消 息 翻译 成 TCP/IP 消 息 以 便 通 过 Internet 传 送 ， 如 


图 16-4 所 示 。 
| 客户 


ORB1 









因特网 (TCP/IP) 





图 16-4 ORB 间 体系 结构 


对 于 网 络 上 其 他 流行 的 协议 也 有 相似 的 翻译 协议 ,比如 点 对 点 协议 (Point-to-Point 
Protocol)， 它 经 常 在 使 用 modem 的 情况 下 用 于 连接 到 网 络 。 对 于 一 些 中 间 件 标准 ， 如 分 布 式 
计算 环境 (Distributed Computing Environment, DCE) 也 有 相似 的 翻译 协议 。 


16.6.2, CORBA 和 数据 库 


CORBA 的 作用 已 经 超出 使 用 它 的 最 初 目的 , 并 迅速 成 为 分 布 式 计算 的 一 个 无 处 不 在 的 标准 。 
最 初 ， CORBA 的 目的 是 允许 客户 端 程序 访问 驻 留 在 服务 器 上 的 对 象 。 然 而 ， 因 为 对 象 是 持久 性 
的 ， 所 以 就 有 可 能 将 这 些 对 象 的 集合 作为 数据 库 来 使 用 。 为 了 实现 数据 库 系统 的 全 部 功能 ， 除 
了 最 基本 的 服务 ， 还 需要 再 提供 一 些 附加 的 CORBA 服 务 。 这 些 服务 现在 集成 在 一 个 体系 结构 层 
CORBAservices 中 ， 它 位 于 基本 的 ORB 机 制 之 上 。 通过 使 用 CORBAservices， 我 们 就 可 以 使 用 
ORB 对 象 来 建造 一 个 功能 性 数据 库 ， 它 包含 了 分 布 在 Intemet 或 其 他 网 络 上 的 异 质 对 象 。 

从 概念 上 讲 ，CORBAservices 是 一 组 提供 特定 服务 的 API， 其 中 包括 事件 通知 服务 、 许 可 
证 服务 (控制 使 用 特定 的 对 象 ， 或 对 使 用 这 些 对象 的 用 户 进行 收费 )、 生命 周 期 服务 (FH 
贝 、 移 动 和 删除 对 象 )。 在 数据 库 上 下 文中 常用 的 服务 有 : 

° 持久 性 服务 (persistence service) 

。 命 名 服务 (naming service ) 

。 对 象 查询 服务 (object query Service ) 

。 事 务 服务 (transaction service ) 

。 并 发 控制 服务 (concurrency control Service ) 

CORBA 通 过 提供 这 些 服务 ， 使 得 不 同位 置 服务 器 上 的 一 组 对 象 能 够 形成 一 个 数据 库 ， 并 提供 
满足 全 部 ACID 事务 性 质 的 访问 s 。 


O 没有 必要 提供 一 个 单独 的 “对 象 更 新 服务 ”， 因为 对 象 只 有 在 客户 调用 它们 的 方法 时 才 更 新 状态 。 这 样 的 
调用 是 ORB 提 供 的 ， 它 位 于 CORBA 服 务 层 的 下 面 。 


IOF HAREE 395 





下 面 是 一 个 使 用 持久 性 对 象 的 CORBA 应 用 的 例子 。 一 些 公司 要 联合 开发 一 个 新 的 产品 
(所 谓 的 虚拟 公司 )。 每 一 个 公司 都 将 自己 所 负责 的 设计 部 分 (图表 、 部 件 列 表 、 文 档 等 等 ) 
作为 持久 对 象 存 放 在 本 地 机 器 上 ， 这 些 对 象 可 能 是 用 不 同 语言 ， 在 不 同 的 操作 系统 下 开发 的 。 
通过 使 用 ORB， 一 个 公司 的 工程 师 可 以 访问 其 他 公司 所 设计 的 对 象 ， 并 可 以 将 它们 集成 到 本 
地 的 文档 中 。 而 且 ， 工 程 师 可 以 使 用 名 字 访 问 某 个 设计 对 象 ， 而 不 需要 知道 它 究竟 存储 在 哪 
个 公司 的 机 器 上 。 查 询 服 务 允许 用 户 对 整个 虚拟 企业 的 对 象 集 进行 查询 ，ORB 使 得 用 户 能 够 
调用 对 象 的 方法 ， 而 事务 和 并 发 控制 服务 使 得 编写 要 求 事务 属性 的 应 用 成 为 可 能 。 

1 . 持久 性 服务 

CORBA 提 供 一 个 让 应 用 与 提供 可 用 IDL 接 口 的 远程 对 象 进行 交互 的 机 制 。 但 是 ， 对 于 数 
据 存储 (例如 ODMG 数 据 库 ) 来 说 缺少 一 种 标准 方式 来 向 它 的 数据 对 象 导 出 接口 并 允许 
CORBA 客 户 端 对 它们 进行 操纵 。 而 且 ， 也 没有 一 个 标准 规定 CORBA 客 户 端 怎样 在 数据 存储 
中 创建 和 删除 一 个 对 象 。 当 然 ， 客 户 端 可 以 在 CORBA 之 外 ， 例 如 ， 用 ODBC 与 数据 库 进 行 交 
H., 但 是 这 违背 了 CORB A 为 构建 分 布 式 应 用 提供 一 致 性 的 基于 对 象 的 接口 的 自 标 。 而 
CORBA 持 久 性 状态 服务 (PSS) 恰好 解决 了 这 个 问题 。 

CORBA 持 久 性 状态 服务 的 整体 架构 如 图 16-5 所 示 。 它 的 基本 思想 是 服务 器 端的 持久 性 对 
象 被 组 织 成 storage home ， 然 后 再 将 storage home 的 集合 组 成 数据 存储 (data store)。 数 据 存储 
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文件 系统 
图 16-5 CORBA 持久 性 状态 服务 的 体系 结构 


在 应 用 端 ， 程序 可 以 同时 使 用 多 个 数据 存储 ， 如 图 16-5 所 示 。 应 用 通过 一 个 特殊 的 方法 
调用 来 连接 到 存储 ， 从 而 开始 对 一 个 数据 存储 的 使 用 。 根据 编程 语言 的 不 同 ， 可 以 应 用 不 同 
的 机 制 来 访问 storage home。 在 面向 对 象 的 语言 (如 Java 或 C++) 中 ， 一 个 storage home 对 应 一 
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个 公共 类 。 为 了 访问 一 个 storage home， 应 用 必须 有 一 个 与 storage home 名 称 相同 的 公共 类 ， 
称 为 storage home 代理 9S 。 为 了 创建 storage home， 程 序 员 必须 提供 一 个 包含 访问 方法 ( 签 
名 及 代码 ) 的 类 定义 。 然 后 这 个 类 需要 在 服务 器 上 编译 并 在 PSS 上 注册 。 

将 storage home 代理 聚合 起 来 的 对 象 就 像 服 务 器 上 的 存储 对 象 的 代理 。 客 户 端 应 用 直接 使 
用 宿主 语言 通过 调用 这 些 代理 的 方法 来 操纵 它们 。 这 些 方法 可 能 直接 访问 存储 对 象 的 高 速 组 
FEN, 或 者 和 服务 器 通信 。PSS 必 须 保证 代理 的 变更 能 够 反映 在 实际 的 存储 对 象 中 。 

很 容易 看 出 ，PSS 的 设计 受到 ODMG 体 系 结构 及 其 减少 或 消除 阻抗 不 匹配 的 目标 的 影响 。 
事实 上 ， 通 过 操纵 代理 ， 会 让 客户 端 程序 感觉 是 在 直接 操纵 持久 性 的 CORBA 对 象 ， 就 好 像 它 
们 是 本 地 对 象 一 样 ， 它 不 需要 使 用 特殊 的 API 来 发 送 和 更 新 对 远程 对 象 的 请 求 。 

2. 命名 服务 

命名 服务 使 用 良好 定义 的 命名 机 制 为 程序 引用 (持久 ) 对 象 提 供 了 方便 的 途径 。 这 个 机 
制 与 操作 系统 中 命名 文件 的 方式 相似 。CORBA 的 命名 空间 是 一 个 有 向 无 围 图， 其 中 每 一 条 边 
用 一 个 简单 名 字 来 标注 。 对 象 的 名 称 由 图 中 从 根 到 该 对 象 的 路 径 上 的 所 有 名 称 连 接 起 来 后 组 
成 。 路 径 不 同 ， 一 个 对 象 可 以 有 多 于 一 个 的 全 名 。 

在 图 书馆 例子 中 ， 除 了 用 前 面 讲 的 home-grown 协 议 来 导出 对 象 引 用 外 ， 服 务 器 可 以 决定 
使 用 通过 CORBA 接 口 NamingContext 定 义 的 ORB 的 命名 机 制 。 这 两 个 重要 的 方法 是 : 

* void blind (in Name n, in Object o); 

e Object resolve (in Name n); 

服务 器 用 第 一 个 方法 将 一 个 特定 的 外 部 名 称 (比如 /Library/myTownLibrary/search ) #8 
定 到 服务 器 创建 的 具体 对 象 上 。 客 户 端 用 第 二 个 方法 将 已 发 布 的 对 象 名 称 作 为 参数 传递 给 方 
法 ， 然 后 取得 CORBA 内 部 对 象 引 用 。 

3. 对 象 查询 服务 

对 象 查询 服务 (OQS ) 使 得 应 用 可 以 查询 CORBA 持 久 性 对 象 。OQS 依 赖 于 ODMG 和 SQL 
标准 ， 给 不 支持 这 些 查 询 语言 的 对 象 存储 提供 OQL 和 SQL 风格 的 查询 功能 。 

OQS 完 整 的 体系 结构 如 图 16-6 所 示 。 客 户 端 应 用 将 查询 传递 给 作用 类 似 ODBC 的 查询 评价 
器 。 然 后 查询 评价 器 经 过 最 小 的 变化 把 查询 传递 给 DBMS ， 或 者 它 可 能 把 一 个 查询 分 成 一 系 
列 的 请 求 并 管理 查询 评价 的 过 程 。 这 样 的 查询 管理 对 于 不 提供 查询 请 求 所 有 特征 的 DBMS 就 
非常 必要 ， 尤 其 是 在 查询 评价 器 作为 非 DBMS 数 据 存储 的 前 端 (例如 : 一 组 电子 数据 表格 )， 
或 有 多 个 数据 存储 的 情况 下 。 

另外 ， 查 询 评价 器 还 创建 一 个 类 型 为 collection 的 对 象 ， 它 的 成 员 是 对 所 有 属于 该 查询 请 
求 结果 的 服务 器 对 象 的 引用 。 这 个 collection 对 象 将 被 传递 给 客户 端 应 用 进行 后 续 处 理 。 

前 面 讨论 过 ODMG Java 绑 定 〈 第 16.4.5 节 ) 和 SQLJ (第 10.5.9 节 ) 中 使 用 的 collection 接 口 。 
CORBA 的 collection 接 口 也 是 类 似 的 。 它 包含 向 collection 中 插入 对 象 和 从 中 删除 对 象 的 方法 ， 
另外 还 增加 了 迭代 器 方法 (iterator method) ， 以 提供 类 似 游标 的 功能 ， 并 人 允许 应 用 一 次 处 理 
collection 中 的 一 个 对 象 。 

注意 ， 尽 管 表示 查询 结果 的 collection 对 象 通常 是 由 查询 评价 器 在 客户 端 创 建 ， 但 

@ ”在 PSS 的 当前 版 本 中 ， 这 个 类 叫做 storage home 实 例 。 我 们 不 使 用 这 个 易 混 光 的 术语 ， 因 为 在 面向 对 象 中 ， 

实例 是 属于 某 个 类 的 一 个 对 象 ， 而 不 是 代表 另 一 个 类 的 类 。 

© Name 数 据 结构 是 在 CORBA 中 定义 的 ， 它 包含 了 一 个 已 发 布 的 对 象 的 字符 串 名 。 
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collection 中 的 成 员 对 象 还 是 保存 在 它们 的 数据 存储 中 。 当 客户 端 调用 查询 结果 对 象 的 方法 时 ， 
ORB 将 这 些 请 求 传送 给 服务 器 上 的 成 员 对 象 。 这样 的 服务 器 端的 处 理 在 CORBA 中 是 很 常见 的 。 
在 这 种 情况 下 ，ORB 只 是 作为 对 象 间 的 一 个 智能 通信 通道 ， 而 对 象 是 保留 在 服务 器 上 的 。 





数据 库 
理 系统 


图 16-6 对 象 查询 服务 的 体系 结构 


4. 事务 和 并 发 控制 服务 

15.3.1 节 介绍 了 事务 管理 器 (transaction manager) tk, 它 组 织 并 协调 一 个 事务 的 运行 
(该 事务 可 能 访问 多 个 分 布 在 不 同 地 理 位 置 的 数据 库 )， 并 且 保证 事务 是 原子 的 (22.3.1 节 中 会 
详细 讲述 这 部 分 内 容 )。CORBA 通 过 事务 服务 (也 称 作 对 象 事务 服务 ,object transaction 
services OTS) 来 提供 相似 的 功能 ， 事务 服务 适用 于 访问 组 不 同 的 持久 性 对 象 或 数据 库 的 
事务 ， 如 图 16-5 所 示 。 

事务 服务 允许 应 用 将 一 个 执行 线程 转变 为 事务 。 一 个 线程 可 以 在 本 线程 的 事务 上 下 文 被 
创建 后 ， 调 用 一 个 特殊 的 事务 对 象 上 的 begin 0 方法 。 事 务 服务 将 在 整个 事务 运行 期 间 保存 此 
上 下 文 。 线 程 还 可 以 调用 commit () 和 rollback 0 方法 来 执行 相应 的 事务 操作 。 

被 事务 修改 了 的 CORBA 对 象 必须 被 声明 为 transactional 和 recoverable， 这 意味 着 它们 可 正 
确 地 响应 commit 和 rollback 命 令 。 Transactional 和 recoverable 对 象 必须 驻 留 在 transactional 和 
recgverable 的 服务 器 上 ， 以 提供 实现 commit 和 rollback 命 令 所 需要 的 登陆 和 其 他 服务 。 

CORBA 也 提供 了 并 发 控制 服务 (concurrency control service), 它 人 允许 应 用 对 CORBA 对 
象 加 锁 和 解锁 ， 并 执行 两 阶段 锁 协 议 (参见 第 15.1.2 节 )， 这 样 就 保证 了 事务 的 隔离 性 。 注 意 ， 
CORBA 级 的 锁 是 独立 于 DBMS 中 的 锁 ， 并 在 其 之 上 的 。 

事务 服务 使 用 两 阶段 提交 协议 (参见 第 15.3.1 节 ) 来 保证 整个 事务 的 全 局 原子 性 ， 该 事务 
可 以 访问 多 个 对 象 ， 包 括 存储 在 数据 库 里 的 持久 性 对 象 (参见 图 16-5)。 所 有 用 这 种 方式 访问 
的 对 象 必须 支持 包含 commit 和 rollback 数 据 库 的 命令 的 X/Open 标 准 API ( 参见 第 22.3.1 节 )。 

事务 服务 不 但 实现 了 通常 的 平坦 事务 模型 (第 21.1 节 ), 而 且 实 现 了 岁 套 事务 模型 (第 
212347). 

注意 ，CORBA 只 支持 并 发 和 事务 语义 ， 但 并 不 强制 执行 。 也 就 是 说 ， 它 并 不 阻止 非 事务 
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的 CORBA 应 用 访问 对 象 ， 也 不 阻止 不 使 用 CORBA 的 数据 访问 对 象 。 这 样 ， 为 了 保证 CORBA 
对 象 语义 具备 ACID 性 质 ， 所 有 的 应 用 必须 都 使 用 事务 和 并 发 控制 服务 。 


16.7 小 结 


在 本 章 的 开头 ， 我 们 讨论 了 传统 的 关系 数据 模型 的 局 限 性 ， 以 及 面向 对 象 的 数据 模型 是 
怎样 解决 这 些 问 题 的 。 接 下 来 介绍 了 面向 对 象 数据 库 的 通用 概念 数据 模型 ， 给 出 了 不 同 的 
ODBMS 的 实现 和 标准 中 的 公共 原则 。 我 们 还 具体 讨论 了 设计 理念 负 异 的 两 个 标准 : ODMG 和 
SQL:1999。 本 章 的 最 后 一 部 分 讨论 了 CORBA ， 它 是 构建 分 布 式 面向 对 象 数 据 存储 的 一 个 新 兴 
的 基础 结构 。CORBA 中 与 数据 相关 的 功能 的 设计 受到 了 ODMG 体 系 结构 的 影响 ， 但 是 它 还 处 
在 不 断 发 展 中 ， 并 且 在 将 来 会 有 细节 上 的 变化 。 


16.8 参考 书目 


面向 对 象 数据 库 的 出 现 与 面向 对 象 语言 的 流行 ， 对 关系 数据 模型 局 限 性 的 认识 等 因素 密 不 可 分 。 使 
用 现 有 的 面向 对 象 语言 作为 数据 操纵 语言 的 想法 首先 在 [Copeland and Maier 1984] 中 被 提出 。 一 种 早期 
的 扩充 关系 数据 模型 的 尝试 一 一 舱 套 关系 ， 出 现在 [Makinouchi 1977, Arisawa et al. 1983, Roth and Korth 
1987, Jaeschke and Schek 1982, Ozsoyoglu and Yuan 1985, Mok et al. 1996] 中 。 

POSTGRES[Stonebreaker and Kemnitz 1991] 是 用 抽象 数据 类 型 扩充 关系 数据 库 的 早期 代表 。 现 在 它 
叫做 PostgreSQL， 是 一 个 功能 强大 的 、 公 开源 码 的 对 象 -关系 PDBMS[PostgreSQL 2000]。 而 对 ODMG 数 
据 模型 及 其 查询 语言 具有 很 大 影响 的 对 象 数据 库 O: 在 [Bancilhon et al. 1990] 中 有 详细 的 描述 。[Cattell 
and Barry 2000] 中 介绍 了 ODMG 标 准 的 最 新 版 本 。[Alagic 1999] 中 讨论 了 ODMG 标 准 设计 中 要 考虑 的 车 
干 问题 〈 及 一 些 可 用 的 解决 方案 ) 。 

16.3 节 中 提 到 的 概念 数据 模型 及 相关 问题 在 [Abiteboul et al. 1995] 中 有 更 详细 的 讨论 。 而 面向 对 象 
查询 语言 的 逻辑 基础 的 发 展 可 以 参考 [Kifer et al. 1995, Abiteboul and Kanellakis 1998]. 

用 路 径 表 达 式 查询 对 象 式 的 结构 的 方式 最 早出 现在 GEM 系 统 中 [Zaniolo 1983]。 路 径 表达 式 后 来 用 
于 所 有 主要 的 对 象 查询 语言 中 ， 包 括 ODL 和 各 种 SQL 的 面向 对 象 的 扩展 ， 如 [Kifer et al. 1992] 中 所 讨论 
的 XSQL。 
早期 支持 对 象 -关系 数据 模型 的 数据 库 有 UniSQL、POSTGRES 和 0:。 现 在 ， 大 多 数 主 流 的 关系 数 
据 库 厂商 (如 Oracle、Informix 和 IBM )， 都 提供 它们 产品 的 对 象 -关系 扩展 。 这 些 系 统 背 后 的 很 多 设计 
理念 都 基于 SQL:1999 标 准 。 更 多 关于 SQL:1999 对 象 关系 扩展 的 内 容 可 以 参考 [Gulutzan and Pelzer 
1999]。 

由 于 SQL:1999 对 象 扩展 还 是 新 生 事物 ， 现 在 还 没有 产品 完全 支持 这 一 标准 。IBM 的 DB/2 在 语法 和 
支持 特性 方面 是 最 接近 这 一 标准 的 。 | : 

[Pope 1998] 是 CORBA 的 一 个 带 有 C 语 言 示 例 的 全 面 介绍 。Java 和 C++ 程序 员 可 以 参考 [Orfali and 
Harkey 1998, Henning and Vinoski 1999] 来 详细 了 解 CORBA。 

本 章 略 去 了 有 关 面向 对 象 数据 库 设 计 的 讨论 ， 而 关系 数据 库 相 对 应 的 内 容 在 第 5 章 和 第 8 章 进行 过 介 
绍 。 这 部 分 没有 介绍 的 内 容 可 以 作为 附加 阅读 材料 。 逐 渐 流 行 的 面向 对 象 数据 库 设 计 方法 是 统一 建 模 语 
H (Unified Modeling Language, UML) [Booch et al. 1999, Fowler and Scott 1999]. 

UML 类 似 于 E-R 建 模 ， 但 是 它 在 一 些 方面 扩展 了 E-R 模 型 ， 尤 其 是 通过 提供 方法 来 规定 数据 库 对 象 
的 外 部 行为 如 ， 对 此 类 对 象 的 公共 方法 应 该 有 什么 要 求 )。 然 而 ，E-R 建 模具 有 简单 性 的 优点 ， 已 经 发 
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展 了 许多 技术 使 之 适应 于 面向 对 象 数 据 库 设计 [Biskup et at. 1996, Biskup et al. 1996b, Gogola et al. 1993, 
Missaoui et al. 1995}. 

尽管 面向 对 象 的 E-R 建 模 已 经 发 展 得 比较 完善 ， 但 相应 的 标准 化 理论 看 起 来 比 关 系 模式 下 的 理论 更 
为 复杂 。 这 个 理论 的 产生 可 以 参考 [Weddell 1992, Ito and Weddell 1994, Biskup and Polle 2000b, Biskup 
and Polle 2000a]。 


16.9 练习 


16.1 请 给 出 有 关 学 生 注册 系统 的 例子 : 
a. 方便 地 使 用 名 / 值 对 属性 。 
b. 方便 地 表达 两 个 对 象 间 的 关系 (用 ODMG 风 格 )。 
c. 方便 地 使 用 继承 。 

16.2 请 给 出 适合 学 生 注册 系统 的 一 组 类 。 

16.3 给 出 一 个 实际 的 例子 ， 说 明 一 个 对 象 可 以 直接 存储 在 对 象 数据 库 (比如 ODMG) 中 , 但 是 不 能 存 
储 在 对 象 ~ 关 系数 据 库 中 。 

16.4 第 16.4.1 节 中 有 对 PERSON 对 象 及 其 联系 Spouse 的 ODL 描 述 。 
a 怎样 用 ODL 来 表达 一 个 人 可 能 ) 有 资助 人 ? 
b. 洽 出 返回 某 个 人 的 资助 人 名 字 的 OQL 查 询 。 

16.5 解 凿 对 象 数 据 库 中 的 对 象 的 oid 和 关系 数据 库 中 元 组 的 主键 的 区 别 。 

16.6 给 出 对 象 数据 库 中 的 对 象 被 认为 相同 的 不 同意 义 。 

16.7 考 度 银行 系统 中 的 AccouNT 类 和 TRANSACTIONACTIVITY 类 。 
a. 为 它们 设计 ODMG ODL 类 定义 。 其 中 ，AccouNT 类 必须 包含 与 TRANSACTIONACTIVITY 中 一 组 对 

和 的 联系 ， 这 组 对 象 对 应 该 账户 的 存 取 事 务 。 

b. 2 一 个 满足 描述 的 对 象 实例 的 例子 。 . 
o AIAR OQLE A: 它 返 回 至 少 取 过 $10 000 的 所 有 账户 的 账户 号 码 。 

16.8 一 个 关系 数据 库 有 一 个 叫做 AccouNTs 的 表 ， 其 中 的 每 一 个 账户 的 元 组 可 能 支持 存储 过 程 deposit () 
和 withdraw 0。 一 个 对 象 数据 库 有 一 个 叫做 AccouNTS 的 类 ， 其 中 每 一 个 账户 对 应 这 个 类 的 一 个 对 
象 ， 并 且 包 含 deposit O 和 withdraw () 两 个 方法 。 解 释 这 两 种 方法 的 优点 和 缺点 。 

16.9 假设 前 面 例子 里 的 对 象 数 据 库 的 AccouNT 类 有 子 类 SAvINGSAccouNTSs 和 CHECKINGAccoUNTS， 并 且 
CHECKINGACCOUNTS 有 子 类 EcoNOMYCHECKINGACCOUNTS。 解 释 继承 语义 怎样 影响 对 每 一 类 对 象 的 检 
索 〈 例 如 ， 当 检索 满足 某 条 件 的 所 有 checking account 对 象 时 ， 哪 些 类 需要 被 访问 )。 

16.10 解释 一 个 set 对 象 和 一 个 由 对 象 所 组 成 的 set 的 区 别 。 

16.11 a. 解释 DDMG 属 性 和 联系 之 间 的 区 别 。 
b. 解释 ODMG 联 系 和 了 PE-R 联 系 之 间 的 区 别 。 

16.12 解释 路 径 表 达 式 的 类 型 一 致 性 的 概念 。 . 

16.13 在 16.4.1 节 的 PERsoN 定 义 中 ， 加 入 恰当 的 SPousE 联 系 的 反 关 系 。 

16.14 给 出 一 个 OQL 查 询 : 返回 16.4.1 节 定义 的 PERSON 中 SSN 为 123-45-6789 的 人 的 所 有 的 孙子 孙女 的 资 
助人 的 姓名 。 

16.:， 假设 PERsoN 类 有 另 一 个 属性 age。 编 写 OQL 查 询 产生 每 一 个 年 龄 的 人 数 。 要 求 使 用 2 种 方法 : 使 
用 GROUP BY 子 句 ， 及 不 用 GROUP BY 而 用 嵌 套 SELECT 语句 。 描 述 每 一 情况 下 的 查询 的 分 析 策 
略 并 解释 哪 种 查询 会 运行 得 更 快 。 
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16.16 写 一 个 OQL 查 询 来 产生 每 个 专业 的 学 生 人 数 。 使 用 (16.8) 中 定义 的 SrupENT 类 。 
16.17 使 用 SQL:1999 (如 果 需 要 ， 使 用 SET OF 结构 ) 来 完成 16.5 节 中 部 分 定义 的 数据 库 模 式 。 必 须 包 
含 下 面 的 UDT:STUDENT、COURSE、PROFESSOR、TEACHING 和 TRANSCRIPT。 
16.18 使 用 上 题 定义 的 模式 回答 下 面 的 查询 : 
a. 找 出 在 数学 系 选课 超过 5 门 的 所 有 学 生 。 | 
b. 用 一 个 UDT GRADE 代表 成 绩 ， 并 且 包 含 返 回 成 绩 数 值 的 方法 value (). 
c. 编写 一 个 方法 为 每 一 个 学 生计 算 平均 成 绩 。 这 个 方法 要 求 使 用 前 面 所 编写 的 value () 方 法 。 
16.19 使 用 SQL:1999 及 附加 的 SETOF 结 构 表示 一 个 银行 数据 库 ， 要 求 包含 账户 、 客 户 和 事务 的 UDT。 
16.20 使 用 SQL:1999 和 前 面 所 创建 的 模式 回答 下 面 的 查询 : 
a. 找 出 住址 邮编 为 12345 的 客户 的 账号 。 
b. 找 出 账户 余额 超过 $1 000 000 的 所 有 客户 。 
16.21 E-R 图 可 以 用 来 设计 对 象 数据 库 的 类 定义 。 给 出 图 5-1、 图 5-5 及 图 5-12 的 ODMG 类 定义 的 E-R 图 。 
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Web 的 出 现 为 信息 技术 开启 了 一 个 全 新 的 领域 ， 也 为 现 有 的 数据 库 框架 带 来 了 新 的 挑战 。 
和 传统 数据 库 不 同 的 是 ，Web 上 的 数据 一 般 不 遵循 任何 广 为 使 用 的 结构 (如 关系 模式 或 对 象 
模式 )。 因 此 ， 仅 仅 使 用 传统 数据 库 的 存储 和 操作 技术 是 不 足以 解决 Web 数 据 的 存储 和 操作 的 。 
鉴于 这 个 原因 ， 我 们 需要 扩充 现 有 的 数据 库 技 术 以 支持 教育 、 商 务 和 政务 等 领域 中 基于 Web 
的 电子 信息 的 传送 和 交换 。 


17.1 半 结 构 化 数据 


初 看 起 来 ，Web 数 据 和 传统 数据 库 中 的 数据 没有 相似 之 处 。 然 而 ， 根 据 它 的 一 些 特征 ， 
我 们 也 可 以 使 用 传统 数据 库 技术 和 信息 检索 技术 来 处 理 Web 数 据 。Web 数 据 的 第 一 个 特征 就 
是 ， 它 们 大 多 以 某 种 结构 化 的 形式 来 表示 。 如 图 17-1 所 示 ，HTML ( 超 文本 标记 语言 ， 
Hypertext Markup Language) 使 用 树 状 的 层次 结构 来 显示 学 生 信息 列表 。 在 这 棵 树 中 ， 不 同 
的 HTML 标 记 对 应 着 不 同 的 数据 元 素 。 


<html> 
<head><Title>Student List</Title></head> 
<body> 
<hi>ListName: Students</hi> 
<dl> 
<dt>Name: John Doe 
<dd>Id: 111111111 
<dd>Address: 
<ul> 
<1i>Number: 123 
<1i>Street: Main St 
</ul> 
<dt>Name: Joe Public 
<dd>Id: 666666666 
<dd>Address: i 
<ul> 
- <li>Number: 666 
<li>Street: Hollow Rd 
</ul> 
.</dl> 
</body> 
</html> 





图 17-1 HTML 描述 的 学 生 信息 列表 


从 表面 上 看 (虽然 机 器 不 会 这 样 识别 数据 ) ，HTML 页面 上 的 信息 是 结构 化 的 学 生 列 表 ， 
它 可 以 用 16.3 节 介绍 的 概念 对 象 数据 模型 (CODM ) 来 表示 (我 们 可 以 在 理解 图 17-1 的 基础 上 
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将 其 转换 为 图 17-2 所 示 的 模式 )。 在 这 个 模型 中 ， 实 际 对 象 出 现在 图 的 上 半 部 分 ， 和 第 16 章 一 
样 ， 对 象 被 表示 为 一 个 Oid-Value 对 。 学 生 列 表 对 应 的 模式 并 未 显 式 地 出 现在 HTML 中 ,但 是 
却 符合 图 17-2 下 半 部 分 所 显示 的 模式 。 


Object: 


(#12345, ["Students", 
{ ("John Doe", "111111111", [123,"Main St"] 1, 
["Joe Public", "666666666", [666,"Hollow Rd"]] } 


1) 
Schema: 


PERSONLIsT [ ListName: STRING, 
Contents: [ Name: STRING, 
Id: STRING, 
Address: [Number: INTEGER, Street: STRING] ] 





图 17-2 学 生 信息 列表 的 对 象形 式 


这 里 ， 我 们 发 现 了 一 个 有 趣 的 事实 ， 那 就 是 ， 尽 管 模式 (包括 属性 名 ) 没有 随 数据 发 送 
过 来 ， 但 我 们 可 以 根据 数据 本 身 的 特征 合理 地 推断 出 数据 遵循 的 数据 结构 。 这 是 因为 ，Web 
网 页 的 设计 者 意识 到 数据 结构 应 该 易于 理解 ， 所 以 构造 出 能 够 自 描述 (self-describing) 的 数 
据 。 数 据 的 这 种 自 描述 性 是 通过 在 数据 域 中 包含 属性 名 来 实现 的 。 

现在 ， 假 设 同样 的 信息 通过 Web 传 送 给 机 器 (而 不 是 人 ) 进行 处 理 。 与 人 不 同 ， 机 器 不 
太 可 能 对 所 接受 到 数据 的 结构 进行 智能 化 的 推测 。 而 且 ， 数 据 模式 也 未 必 有 良好 的 定义 ， 例 
如 ， 在 列表 中 ， 有 的 学 生 可 能 具有 额外 的 属性 (如 电话 号 码 )， 或 者 某 个 属性 不 能 确定 ， 如 住 
址 《可 以 使 用 邮箱 号 码 来 取代 街道 地 址 )。 因 此 ， 为 了 方便 计算 机 之 间 的 信息 交换 ， 遵 循 统一 
的 格式 ， 通 过 在 数据 中 区 分 属性 名 和 值 来 实现 数据 的 自 描述 非常 有 意义 。 

总 之 ， 用 于 机 器 处 理 的 Web 数 据 可 能 具有 以 下 特征 : 

“ 对象 特征 (objectlike)， 即 可 以 使 用 16， 3 地 描述 的 CODM 模 型 表示 的 对 象 集合 来 表示 

Web 数 据 。 

* ARMA (schemaless)， 即 与 16.3 节 讨论 的 对 象 不 同 ，Web 数 据 并 不 保证 遵循 任何 确定 的 

类 型 结构 。 

- 。 自 描述 性 (self-describing )。 

具备 上 述 特征 的 数据 称 为 半 结 构 化 (semistructured) 数据 。 其 中 的 自 描述 性 特征 可 能 会 
造成 某 种 程度 的 误导 ， 因 为 它 可 能 被 误解 为 : 数据 的 含义 伴随 着 数据 本 身 。 事 实 上 ， 半 结构 
化 数据 仅仅 具有 属性 的 名 称 ， 而 且 ， 与 传统 数据 库 中 的 数据 相 比 ， 组 织 化 的 程度 不 高 。 特 别 
地 ， 因 为 缺乏 模式 ， 所 以 不 能 保证 所 有 的 对 象 都 具有 一 样 的 属性 ， 也 不 能 保证 不 同 对 象 的 同 
名 属性 具有 同样 的 含义 。 

根据 观察 ， 图 17-2 不 足以 完整 地 表达 图 17-1 中 的 数据 。 原 因 在 于 ，CODM 的 对 象 表示 法 和 
模式 表示 法 并 不 是 用 来 表示 自 描述 数据 。 然 而 ， 通 过 引进 CODM 的 对 象 表示 法 与 模式 表示 法 
中 的 元 素 ， 可 以 开发 出 一 种 合适 的 表示 方法 。 利 用 新 的 表示 法 ， 我 们 的 学 生 列表 可 以 表示 为 
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如 下 的 无 模式 但 具备 自 描述 性 的 形式 : 
(#12345, 
[ListName:"Students", 
Contents:{ [Name:"John Doe", 
. Td: "111111111", 
Address: [Number :123, Street:"Main St"]], (17.1) 
[Name:"Joe Public", 
Id: "666666666", 
Address: [Number :666, Street: "Hollow Rd"]] } 

] ) 

上 面 的 描述 能 恰如其分 地 表示 半 结 构 化 数据 ， 而 且 它 还 很 好 地 遵循 了 数据 库 的 习惯 。 然 
而 ， 这 并 不 是 Web 数 据 交 换 所 选用 的 格式 。Web 数 据 交 换 选 用 的 是 可 扩展 标记 语言 
(Extensible Markup Language, XML) 一 一 1998 年 被 W3C (World Wide Web Consortium) 采 
纳 的 一 套 标 准 。 

自问 世 以 来 ，XML 被 越 来 越 多 的 人 认同 和 接受 ， 并 逐步 成 为 人 类 世界 和 机 器 世界 中 信息 
表示 的 标准 格式 。 下 一 节 我 们 将 介绍 XML 语言 的 各 个 组 成 部 分 并 给 出 相关 的 实例 。 

尽管 在 本 质 上 ，XML 数 据 是 无 模式 的 ， 但 是 符合 一 定 模式 的 数据 通常 有 更 大 的 用 处 。 特 
别 是 ， 根 据 电子 数据 交换 的 需要 ， 数 据 在 传输 时 对 数据 格式 严格 性 的 要 求 超出 了 半 结 构 化 数 
据 所 提供 的 严格 性 。 为 此 ，XML 提 供 一 个 说 明文 档 结 构 的 可 选 机 制 。 我 们 讨论 两 种 这 样 的 机 
Hill: 文档 类 型 定义 语言 (Document Type Definition，DTD )， 它 是 XML 标准 的 一 个 组 成 部 分 。 
另 一 种 是 XML Schema， 它 是 最 近 出 现 的 一 种 建立 在 XML 基础 上 的 规格 说 明 。 在 本 章 的 最 后 ， 
我 们 还 将 介绍 三 种 XML 查询 语言 : XPath (一 种 轻 量 级 的 查询 语言 )、XSLT (文档 翻译 语言 )， 
以 及 XQuery (完整 的 XML 查询 语言 ) 。 想 进一步 研究 半 结 构 化 数据 的 读者 ， 建 议 参 考 
[Abiteboul et al.2000] 以 及 本 书 参 考 文献 部 分 包含 的 其 他 文章 。 


17.2 XML 概述 


XML 不 能 解决 世界 上 所 有 的 问题 ， 也 不 是 一 个 革命 性 的 思想 。 实 际 上 ， 它 甚至 不 是 一 个 
新 想法 ， 那 么 ， 为 什么 它 正在 引起 一 场 革命 呢 ? 简单 地 说 ，XML 是 人 和 机 器 都 能 读 伐 的 数据 
格式 ， 它 易于 解析 ， 所 以 简化 了 数据 交换 过 程 。 过 去 ， 人 们 也 提出 过 几 种 数据 交换 格式 ， 但 
它们 要 么 是 非 开放 的 专 有 标准 ， 要 么 不 够 优秀 ， 不 足以 吸引 大 家 为 发 展 它 而 努力 。 而 XML 却 
在 合适 的 时 间 出 现在 了 合适 的 地 方 。 人 们 已 经 看 到 ， 通 信 、 教 育 和 商业 领域 中 Web 和 开放 标 
准 的 作用 ， 同 时 也 明确 了 简化 软件 代理 之 间 的 数据 交换 的 要 求 。 一 个 值得 信任 的 标准 组 织 ， 
W3C (不 隶属 于 任何 团体 和 政府 ) 也 帮助 了 该 标准 的 推广 。. 这 是 第 一 次 出 现 了 一 个 简单 的 、 
开放 的 、 被 广泛 接受 的 数据 标准 ， 它 对 于 Web 应 用 起 到 了 极 大 的 推动 作用 。 

XML 是 一 种 类 似 于 HTML 的 语言 ， 它 支持 任意 数量 的 用 户 自 定义 标记 (tag )， 而 且 这 些 
标记 事先 并 没有 确定 的 语义 。 为 了 更 好 地 理解 这 句 话 意思 ， 让 我 们 再 来 看 看 HTML， 在 这 种 
文档 格式 中 ， 我 们 使 用 标记 来 标明 各 个 文本 块 ， 这 些 标记 将 影响 到 文本 在 浏览 器 中 的 显示 。 
重要 的 一 点 是 ，HTML 中 标记 的 数量 被 HTML 定义 所 固定 ， 每 一 个 标记 都 具有 明确 的 定义 。 例 
如 ， 标 记 <table> 和 </table> 之 间 的 文本 将 被 浏览 器 显示 为 一 张 表 ， 而 标记 <p> 则 告诉 浏览 器 开 
始 一 个 新 的 段落 。 和 HTML 不 同 的 是 ，XML 没 有 预定 的 标记 指令 系统 ， 用 户 可 以 自由 地 引入 
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新 的 标记 名 ， 而 且 ， 任 意 一 个 XML 标记 都 没有 预定 的 语义 。 

XML 缺乏 语义 似乎 是 一 个 倒退 。 浏 览 器 怎样 才能 知道 如 何 处 理 接收 到 的 文件 呢 ? 答案 在 
于 ， 应 该 在 XML 文档 之 上 建立 不 同 的 语义 层 ， 并 且 可 以 为 不 同类 型 的 应 用 进行 定制 。 浏 览 器 
显示 只 是 其 中 的 一 种 。 用 于 浏览 器 显示 的 文档 的 语义 用 样式 表 (stylesheet) 表示 (参见 17.4.2 
节 )。 然 而 ， 大 部 分 XML 文档 都 由 应 用 程序 中 进行 交换 ， 这 些 应 用 程序 并 不 会 显示 在 屏幕 上 供 
人 类 阅读 。 这 时 ， 语 义 由 应 用 领域 而 定 。( 因此， 同一 个 应 用 领域 可 以 共享 同一 个 语义 系统 。) 
整个 行业 就 可 以 开发 出 不 同 的 语义 层 ， 以 表示 目录 信息 、 商 业 信息 、 工 程 信息 以 及 其 他 信息 。 
然而 ， 这 些 工作 都 需要 有 定义 数据 模式 的 能 力 。 我 们 将 在 17.2.4 节 和 17.3 节 中 讨论 XML 中 可 用 
的 结构 化 机 制 ， 但 必须 注意 ， 尽 管 定义 了 模式 ， 但 XML 数据 本 身 仍然 是 半 结 构 化 的 。 对 模式 
的 遵循 仍然 是 可 选 的 ， 应 用 程序 也 可 以 自由 地 忽略 部 分 或 全 部 数据 模式 定义 。 

举 个 例子 ， 让 我 们 来 看 看 图 17-3 的 文档 ， 它 是 图 17-1 中 学 生 信息 列表 的 一 种 XML 表 示 方 
法 。 第 一 行 是 强制 性 语句 ， 告 诉 程序 (这 种 程序 被 称 为 XML 处 理 器 ) 接收 文档 ， 而 且 规 定 该 
文档 的 版 本 为 XML1.0 版 本 。 其 他 部 分 除了 以 下 两 点 (这 两 点 非常 重要 ) 之 外 ， 和 HTML 文 档 
有 着 相同 的 结构 : i 


<?xml version="1.0" ?> 
<PersonList Type="Student" Date="2000-12-12"> 
<Title Value="Student List"/> 
<Contents> 
<Person> 
<Name>John Doe</Name> 
<Id>111111111</Id> 
<Address> 
<Number>123</Number> 
<Street>Main St</Street> 
</Address> 
</Person> 
<Person> 
<Name>Joe Public</Name> 
<Id>666666666</Id> 
<Address> 
<Number>666</Number> 
<Street>Hollow Rd</Street> 
</Address> 
</Person> 
</Contents> 
</PersonList> 





图 17-3 学 生 信息 列表 的 XML 表示 


“XML 文档 作者 可 以 使 用 各 种 不 同 的 标记 构造 XML 文档 。 而 在 HTML 中 却 不 可 以 这 样 艇 ， 
只 有 在 HTML 官 方 规格 说 明 中 明确 定义 的 标记 才 是 正确 的 标记 ， 其 他 标记 浏览 器 均 不 
识别 。 

“XML 中 每 一 个 起 始 标记 都 要 有 一 个 结束 标记 和 它 匹 配 ， 而 且 这 些 标记 的 网 套 顺 序 必 须 
正确 ( 即 ，<a><b></a></b> 顺 序 就 是 不 正确 的 )。 而 一 些 HTML 的 标记 并 不 要 求 有 匹配 
的 结束 标记 (如 <p>)， 即 使 遗漏 了 结束 标记 ， 浏 览 器 也 能 正确 地 处 理 HTML 文档 。 
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“XML 文档 必须 有 一 个 根 元 素 (root element)。 根 元 素 包含 其 他 所 有 的 元 素 。 在 图 17-3 中 ， 
根 元 素 是 PersonList. 

任意 一 个 形 如 <sometag>...……..</sometag> 且 人 岁 套 正确 的 文本 块 均 是 一 个 XML 元 素 (XML 
element)， 其 中 sometag 是 元 素 的 名 字 。 起 始 标 记 (<sometag>) 和 结束 标记 (</sometag>) 之 
间 的 文本 叫做 元 素 的 内 容 (content)。 包 含 在 A 元 素 中 的 元 素 是 A 元 素 的 子 元 素 (children), 
例如 在 上 例 中 ，Name、Id 和 Address 是 Person 的 子 元 素 ， 而 Person 是 Contents 的 子 元 素 ， 
Contents 又 是 Personlist 的 子 元素 。 相 应 地 ， 我 们 说 PersonList 是 Contents 和 Title 的 父 元 素 
(parent), ，Contents 是 Person 的 父 元 素 。 

XML 也 定义 了 元 素 之 间 的 祖先 (ancestor) /后 代 (descendant) 关系 ， 这 对 于 XML 的 查询 
来 说 是 很 重要 的 ， 我 们 将 在 17.4 节 向 大 家 介绍 这 部 分 内 容 。 这 种 祖先 /后 代 关 系 和 人 类 家 族 中 
的 祖先 /后 代 关 系 一 样 ， 祖 先是 父亲 、 祖 父 或 曾祖 父 等 等 ， 后 代 是 儿子 、 孙 子 、 曾 孙 等 等 。 例 
如 ，PersonList 是 Person 和 Address 的 祖先 ， 而 Address 是 PersonList 的 后 代 。 

起 始 标记 可 以 有 属性 (attribute ) 。 如 图 17-3 所 示 ，<PersonList Type = "Student"> 标 记 中 
的 Type 就 是 元 素 PersonList 的 一 个 属性 名 ，Student 是 属性 的 值 。 和 HTML 不 同 ， 所 有 的 属性 值 
必须 用 “” 括 起 来 ， 但 标记 之 间 的 字符 串 不 需要 用 “” 括 起 来 。 再 看 另 一 个 例子 ，<Title 
Value = "Student List"/> 说 明 Title 包 含 了 一 个 属性 Value。 和 一 般 的 表示 方法 不 一 样 ，Title 元 素 
没有 对 应 的 结束 标记 ， 而 是 直接 放 入 到 <.../> 中 。 由 于 不 含有 其 他 内 容 ， 所 以 称 其 为 空 元 素 
(empty element)。 在 XML 中 ， 上 面 的 声明 方式 是 <Title Value= “Student List” > </Title> 组 合 
的 简写 。 

除了 元 素 和 属性 外 ，XML 还 允许 使 用 处 理 指令 (processing instruction) 和 注释 
(comments )。 处 理 指令 是 如 下 形式 的 语句 


<?my-command go bring coffee?> 


文档 作者 可 以 使 用 处 理 指令 告诉 XML 处 理 器 该 怎样 处 理 文档 。 处 理 指令 很 少 使 用 ， 在 17.4.2 
节 中 ， 与 XML 样式 表 结 合 时 用 到 了 一 个 处 理 指 令 。 

注释 的 一 般 形式 如 下 : 

<! -注释 内 容 --> 
除了 在 标记 中 ， 即 在 开始 标记 (<) 和 结束 标记 (>) 之 间 以 及 类 似 的 地 方 不 能 使 用 注释 外 ， 
任何 位 置 均 可 以 使 用 注释 。 注 释 是 XML 文档 的 一 个 不 可 缺少 的 组 成 部 分 一 一 文档 的 撰写 者 在 
传送 之 前 不 会 将 它 删 除 ， 接 收 者 可 以 浏览 注释 以 获得 一 定 的 信息 。 尽 管 这 种 处 理 注释 的 方法 
和 当前 流行 的 编程 语言 以 及 数据 库 语 言 中 处 理 注 释 的 方法 不 一 样 ， 但 文档 处 理 中 并 不 鲜 见 。 
例如 ，JavaScript 程 序 经 常 被 放 在 HTML 文 档 中 担任 注释 的 角色 ，HTML 处 理 器 不 一 定 忽略 它 
们 。 相 反 ， 除 非 JavaScript 特 性 被 关闭 ， 否 则 处 理 器 将 会 执行 注释 中 发 现 的 JavaScript 程 序 。 

XML 的 另 一 个 需要 简单 说 明 的 特征 就 是 CDATA 构 造 。CDATA 允 许字 符 串 包含 标记 元 素 ， 
这 些 标记 元 素 可 能 会 导致 不 正确 的 文档 格式 。 举 个 例子 ， 如 果 我 们 使 用 XML 写 一 个 关于 Web 
发 布 的 结构 化 的 指南 ， 可 能 会 用 到 下 列 文 本 : 


Web 浏 览 器 试图 纠正 发 布 者 诸如 标记 谋 套 错误 等 错误 .例如 <b><i>Attention!</b></i> 
这 笠 的 错误 ， 大 部 分 的 浏览 器 都 能 正确 地 处 理 它 。 
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- 然而， 这 样 的 字符 串 因 为 会 导致 不 正常 的 文档 结构 而 被 所 有 遵循 XML 标准 的 浏览 器 所 拒 
绝 。 一 个 方便 的 、 能 够 正确 包含 这 样 的 串 的 方法 如 下 : 


<! [CDATA[ Web 浏 览 器 试图 纠正 发 布 中 诸如 标记 谋 套 错误 等 错误 。 例 如 
<b><i>Attention!</b></i> 这 样 的 错误 ， 大 部 分 的 浏览 器 都 能 正确 地 处 理 它 。]]> 


最 后 ， 每 一 篇 XMEL 文 档 都 可 以 有 一 个 可 选 的 文档 类 型 定义 (Document Type Definition, 
DTD) 文件 。DTD 文 件 决定 XML 文档 的 结构 。 我 们 将 在 17.4.2 节 讨论 DTD。 


17.2.1 XML 元 素 和 数据 库 对 象 

现在 ， 我 们 对 图 17-3 中 的 XML 文档 作为 Web 上 传送 半 结 构 化 数据 的 格式 进行 一 些 评价 。 
显然 ， 元 素 名 可 以 有 效 地 用 作对 象 的 属性 名 (XML 的 属性 名 也 有 同样 的 作用 )。 所 以 ， 该 文档 
本 质 上 是 (17.1) 中 自 描述 对 象 的 另 一 种 等 价 的 文字 描述 。 

1.XMEL 元 素 到 对 象 的 转换 ， 

思考 一 下 ， 就 会 发 现 ，XML 的 嵌 套 标记 结构 非常 适合 表示 树 结构 的 自 描述 对 象 。XML 文 
档 的 每 一 个 元 素 可 以 看 作 一 个 对 象 。 其 子 元 素 的 标记 名 对 应 于 对 象 的 属性 ， 子 元 素 自身 则 是 
该 属性 的 值 。 例 如 ， 图 17-3 中 的 第 一 个 Person 元 素 就 可 以 部 分 地 转换 为 如 下 对 象 : 

{#6543, Name: "John Doe", 

Id: "111111111", 
Address: <Address> 
<Number>123</Number> 
<Street>Main St</Street> 
</Address> 

} 

转换 过 程 具有 递归 性 。 像 Name 和 Id 这 样 简单 的 元 素 可 以 通过 抽取 它们 的 内 容 直 接 进 行 转 
换 。 元 素 Address 暂 时 不 变 ， 因 为 它 具 有 复杂 的 内 部 结构 ， 这 些 内 部 结构 可 以 通过 递归 地 调用 
相同 的 转换 进程 来 进一步 分 解 。 这 样 会 产生 一 个 新 的 地 址 对 象 : - 

{#098686, Number: "123", 

Street: "Main St" 

} 

2. XML 元 素 和 对 象 之 间 的 区 别 

尽管 XML 元 素 和 结构 化 数据 库 对 象 之 间 存 在 明显 的 对 应 关系 ， 但 它们 之 间 还 是 存在 着 根 
本 性 的 区 别 。 首 先 ，XML 是 由 SGML[SGM1986] 发 展 而 来 ， 而 且 深 受 SGML 的 影响 ， 而 SGML 
是 一 种 文档 标记 语言 而 不 是 数据 库 语 言 。 举 个 例子 ，XML 人 允许 下 列 形式 的 文档 : 


-<Address> 
Sally lives on 
<Street>Main St</Street> 
house number 
<Number>123</Number> 
in the beautiful Anytown, USA. 
</Address> 


该 文档 既 有 数据 结构 又 有 文本 结构 ， 这 在 XML 中 是 允许 的 ， 但 这 种 文档 不 便于 自动 化 处 理 ， 
而 且 这 种 风格 的 文档 是 真正 的 数据 库 设计 者 所 不 愿意 使 用 的 。 
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其 次 ，XML 元 素 具有 有 序 性 ， 而 数据 库 对 象 的 属性 却 不 具备 这 种 性 质 。 因 此 ， 下 面 两 个 
对 象 可 以 看 作 是 同一 个 : 


{#098686, Number: "123", {#098686, Street: "Main St", 
Street: "Main St" Number: "123" 
} } 
而 下 面 两 个 XML 文档 却 是 不 同 的 : 

<Address> <Address> 
<Number>123</Number> <Street>Main St</Street> 
<Street>Main St</Street> <Number>123</Number> 

</Address> </Address> 


再 次 ，XML 只 有 一 种 基本 数据 类 型 一 一 字符 型 ， 而 且 规 定 文档 约束 的 机 制 并 不 强 。 幸 运 
的 是 ， 这 些 缺 点 中 的 大 部 分 可 以 通过 17.3 节 的 XML Schema 规范 来 解决 。 


17.2.2 XML 属性 


在 图 17-3 中 ， 我 们 已 经 看 到 了 Type 和 Value 这 样 的 XML 属性 的 用 法 了 。 一 个 元 素 可 以 有 任 
意 数 量 的 用 户 自 定 义 属性 。 然 而 ， 回 忆 一 下 前 文 所 举 的 例子 中 XML 元 素 的 表达 能 力 ， 我 们 陷 
入 了 对 作为 数据 表示 工具 的 XML 属 性 所 扮演 的 角色 的 困惑 之 中 ， 更 确切 地 说 ， 它 们 对 于 数据 
表示 是 否 有 用 呢 ? 它 们 能 表达 元 素 不 能 表达 的 内 容 吗 ? 

答案 是 ，XML 属 性 有 时 更 便于 表示 数据 ， 但 属性 所 能 做 到 的 ， 元 素 都 也 可 以 做 到 。 而 且 ， 
利用 新 出 现 的 基于 XML 的 标准 ， 如 XML Schema (将 在 17.3 节 中 介绍 )， 我 们 期 望 用 属性 来 表 
示 数 据 的 情况 逐渐 消失 。 但 是 ， 属 性 还 是 广泛 应 用 于 基于 XML 的 规范 ， 如 XML Schema 和 
XSLT (我 们 将 在 本 章 后 面 的 内 容 中 介绍 他 们 ) 中 。 我 们 的 例子 中 也 大 量 地 使 用 了 属性 ， 这 是 
为 了 阐明 XML 的 各 种 特性 ， 而 且 使 用 属性 能 更 简洁 地 表示 数据 。 

在 文档 的 处 理 中 ， 属 性 经 常用 于 解释 起 始 标记 和 结束 标记 之 间 带 有 值 (该 值 不 是 文本 的 
一 部 分 ， 但 和 文本 内 容 紧密 相关 ) 的 文本 ， 在 下 面 的 程序 中 : 


<Act Number="5"> 
<Scene Number="1" Place="Mantua. A street."> 


<Apothecary Voice="scared"> 
Such mortal drugs I have; but Mantua's law 
Is death to any he that utters them. 
</Apothecary> 
<Romeo Voice=" persistent! '> 
Art thou so bare and full of wretchedness, 
And fear'st to die? 


</Romeo> 


</Scene> 
</Act> 


我 们 使 用 属性 来 解释 那些 本 质 上 不 是 程序 内 容 但 又 和 程序 内 容 相 关 的 “元 ”信息 。 本 例 中 ， 
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属性 的 使 用 非常 方便 ， 这 是 因为 ,这 里 的 属性 并 不 影响 数据 流 。 另 一 方面 ， 在 数据 处 理 中 ， 
文本 流 不 太 受 关注 ， 因 为 目前 的 计算 机 技术 不 太 可 能 在 不 久 的 将 来 重视 这 种 风格 的 文档 。 这 
里 我 们 关注 的 是 用 XML 属性 描述 另外 一 个 数据 表示 中 的 非 必要 的 ， 但 却 是 数据 库 程序 员 所 忧 
虑 的 方面 。 

另外 ， 属 性 值 只 能 是 字符 串 ， 这 一 点 严格 地 限制 了 属性 的 使 用 ， 相 比较 而 言 ， 元 素 可 以 
有 子 元 素 ， 从 而 使 之 呈现 出 多 样 性 。 

对 属性 进行 了 这 些 坦率 的 评价 后 ， 我 们 应 该 提 及 属性 的 一 些 优 点 。 首 先 ， 元 素 中 多 个 属 
性 之 间 的 顺序 对 文档 不 产生 影响 ， 因 此 ， 文 档 <thing price= “2” color= “yellow” > 
foobar</thing> 和 <thing color=“yellow”price=“2”>foobar</thing> 完 全 一 样 ， 如 同 它们 在 数 
据 库 中 一 样 。 其 次 ， 同 一 属性 只 能 出 现 一 次 〈 即 <thing price=“2”price=“2”> 是 错误 的 )。 
然而 ， 正 如 我 们 在 图 17-3 中 看 到 的 那样 ， 具 有 同样 标记 的 元 素 可 以 重复 出 现 。 再 次 ， 使 用 属 
性 可 以 将 数据 表达 得 更 为 简洁 。 例 如 ，<thing price=“2”color=“yellow”/> 比 
<thing><price>2</price><color>yellow</color></thing> 简 洁 得 多 。 

XML 属性 的 一 个 非常 有 用 的 性 质 就 是 ， 可 以 将 属性 值 声 明 为 唯一 值 。 这 一 性 质 可 以 用 来 
强制 执行 有 限 类 型 的 参照 完整 性 。 当 然 ， 仅 仅 使 用 XML 文档 本 身 并 不 能 实现 参照 完整 性 (但 
是 ， 利 用 17.3 节 中 讨论 的 XML Schema 的 帮助 ， 我 们 就 能 作 到 这 一 点 ， 甚 至 更 多 )。 介 绍 完 
DTD 以 后 ， 就 可 以 明白 属性 可 以 被 定义 成 ID、IDREF 和 IDREFS 等 类 型 。 

ID 属性 的 一 个 特征 就 是 : 在 整个 文档 范围 内 ， 其 属性 值 必须 唯一 。 这 意味 着 ,假设 有 两 
个 ID 类 型 的 属性 attr1 和 attr2 ， 如 果 <eltl attrl= “abc” >F<elt2 attr2=“abc”> 出 现在 同一 个 
XML 文档 中 ， 那 就 是 错误 的 (无 论 elt1 和 elt2 是 否 为 同样 的 标记 ，attr1 和 attr2 是 否 为 同样 的 属 
性 )。 从 某 种 意义 上 来 说 ，ID 相 当 于 关系 数据 库 中 的 键 。IDREF 类 型 的 属性 必须 引用 在 同一 文 
档 中 声明 的 有 效 的 ID。 也 就 是 说 ， 它 的 值 必 须 作 为 ID 类 型 的 另 一 个 属性 的 值 在 文档 的 其 他 地 
方 出 现 。 因 此 ，IDREF 类 似 于 关系 数据 库 中 的 外 键 。 

为 了 进一步 说 明 ， 我 们 考察 图 17-4 中 的 报告 文档 。IDREF 类 型 的 属性 表示 一 个 独立 的 指 
向 有 效 ID 的 字符 串 列 表 。 在 图 17-4 中 ， 我 们 为 元 素 Student 定 义 了 一 个 ID 类 型 的 属性 StduID， 
为 元 素 Course 定 义 了 一 个 ID 类 型 的 属性 CrsCode ， 元 素 CrsTaken 的 属性 CrsCode 是 IDREE 类 型 
的 ， 元 素 ClassRoster 的 属性 Members 也 属于 IDREF 类 型 。 结 果 ，XML 处 理 器 会 验证 同一 个 学 
生 或 同一 门 课 不 会 被 重复 定义 ， 同 时 还 能 保证 参照 完整 性 ， 如 CrsRoster 不 能 引用 不 存在 的 
Course， 而 所 有 Members 列 表 中 的 Student 都 必须 存在 。 

现在 ， 我 们 可 以 定义 一 个 重要 的 正确 性 的 要 求 。 一 个 XML 文档 如 果 满 足下 列 条 件 ， 那么 
它 就 是 一 篇 形式 良好 (well formed) 的 文档 : - 

。 有 一 个 根 元 素 。 

. 每 一 个 起 始 标记 后 面 都 有 一 个 与 之 匹配 的 结束 标记 ， 而 且 元 素 的 谋 套 关系 正确 。 

“在 同一 个 起 始 标记 中 ， 任 何 属性 最 多 只 能 出 现 一 次 ， 同 时 要 给 定 属性 值 ， 并 且 属 性 值 应 

该 用 引号 括 起 来 。 
注意 ， 关于 ID、IDREF 和 IDREFS 的 限制 并 不 是 定义 的 一 部 分 ， 因 为 这 些 属性 类 型 由 DTD 进 行 
指定 ， 而 形式 良好 的 定义 却 完全 忽略 DTD 。 
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<?xml version="1.0" ?> 
<Report Date="2000-12-12"> 
<Students> 
<Student StudId="111111111"> 
<Name><First>John</First><Last>Doe</Last></Name> 
<Status>U2</Status> 
<CrsTaken CrsCode="CS308" Semester="F1997"/> 
<CrsTaken CrsCode="MAT123" Semester="F1997"/> 
</Student> 
<Student StudId="666666666"> 
<Name><First>Joe</First><Last>Public</Last></Name> 
<Status>U3</Status> 
<CrsTaken CrsCode="CS308" Semester="F1994"/> 
<CrsTaken CrsCode="MAT123" Semester="F1997"/> 
</Student> 
<Student StudId="987654321"> 
<Name><First>Bart</First><Last>Simpson</Last></Name> 
<Status>U4</Status> 
<CrsTaken CrsCode="CS308" Semester="F1994"/> 
</Student> 
</Students> 
<Classes> 
<Class> 
<CrsCode>CS308</CrsCode><Semester>F1994</Semester> 
<ClassRoster Members="666666666 987654321"/> 
</Class> 
<Class> 
<CrsCode>CS308</CrsCode><Semester>F1997</Semester> 
<ClassRoster Members="111111111"/> 
</Class> 
<Class> 
<CrsCode>MAT123</CrsCode><Semester>F1997</Semester> 
<ClassRoster Members="111111111 666666666"/> 
</Class> 
</Classes> 
<Courses> 
<Course CrsCode="CS308"> 
<CrsName>Market Analysis</CrsName> 
</Course> 
<Course CrsCode="MAT123"> 
<CrsName>Algebra</CrsName> 
</Course> 
</Courses> 
</Report> 





图 17-4 具有 交叉 引用 的 报告 文档 


17.2.3 命名 空间 


最 初 的 XML 规范 并 没有 考虑 命名 空间 (namespace)， 后 来 才 把 命名 空间 补充 进来 。 然 而 ， 
时 至 今日 ， 命 名 空间 却 成 为 在 XML 之 上 构建 的 许多 重要 标准 的 核心 部 分 ， 所 以 从 实用 的 角度 
上 看 ,我 们 认为 它 是 XML 必 不 可 少 的 特征 。 

引入 命名 空间 源 于 人 们 相信 ， 在 不 远 的 将 来 ， 企 业 会 构造 适合 不 同 领域 的 术语 词汇 表 
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(如 教育 、 商 业 、 电 子 )， 并 使 用 这 些 词汇 作为 XML 标记 。 在 这 种 情况 下 ,不同 词汇 表 之 间 的 
名 字 神 突 是 不 可 避免 的 ， 集 成 来 自 不 同 信息 源 的 信息 将 变 得 非常 困难 。 例 如 ， 依 据 谈论 的 对 
象 是 人 或 公司 ， 术 语 Name 可 能 具有 不 同 的 含义 和 结构 ， 如 同 下 面 看 到 的 两 个 文档 片段 : 


<Name><First>John</First> <Last>Doe</Last></Name> 
<Name>IBM</Name> 


因此 ， 应 用 程序 对 那些 在 含有 冲突 标记 的 单词 表 上 构建 的 文档 的 处 理 将 变 得 非常 困难 。 

为 了 解决 这 个 问题 ， XML 标记 名 必须 由 两 部 分 组 成 : 命名 空间 (namespace) 和 本 地 名 
(local name ) ， 其 一 般 结构 如 下 : 命名 空间 : 本 地 名 。 除 了 其 中 多 了 一 个 “:” 外 ， 本 地 名 和 
一 般 的 XML 标 记 没 有 什么 区 别 。 命 名 空间 以 一 个 统一 资源 标识 符 (Uniform Resource 
Identifier, URI) 形式 的 字符 串 表 示 ， 这 样 的 URI 可 以 是 一 个 抽象 标识 串 〈 用 作 唯 一 标识 名 
的 通用 字符 串 ) 或 者 以 统一 资源 定位 器 (Uniform Resource Locator, URL) 的 形式 表示 命名 
空间 。 

这 个 想法 看 起 来 比较 简单 : 不 同 的 作者 使 用 不 同 领域 的 不 同 的 命名 空间 标识 符 ， 因 此 就 
能 避免 术语 的 冲突 。 自 从 命名 空间 问世 以 来 ， 大 家 就 一 直 遵 循 这 一 规则 ， 即 作者 选择 他 们 掌 
担 的 URL 作 为 命名 空间 的 标识 符 。 例 如 ， 如 果 Joe Public 为 Acme 公 司 服务 的 学 校 制定 了 一 个 单 
词 表 ， 所 使 用 的 命名 空间 为 : 


http://www.acmeinc.com/jp#supplies 


而 把 玩具 的 命名 空间 定 为 : 


http://www .acmeinc .com/jp#toys 


WwW 组 织 (W3C) 建议 书 9 中 包含 的 XML[Nam 1999] 的 命名 空间 并 不 仅仅 是 简单 的 两 
部 分 命名 模式 ， 它 也 确定 了 专门 的 语法 来 声明 命名 空间 、 它 们 的 使 用 及 作用 范围 。 下 面 是 一 
个 例子 : 


<item xmlns="http://www.acmeinc.com/jp#supplies" 
xmlns:toy="http://www.acmeinc.com/jp#toys"> 
<name>backpack</name> 
<feature> 
<toy:item> 
<toy :name>cyberpet</toy : name> 
</toy:item> 
</feature> 
</item> 


这 里 ， 命 名 空间 用 属性 xmlns 定 义 ， 这 是 一 个 保留 字 。 实 际 上 ,，W3C 建 议 所 有 以 xzml 开 始 
. 的 名 字 都 保留 为 该 组 织 使 用 。 本 例 中 ， 我 们 在 item 元 素 的 作用 范围 内 声明 了 两 个 命名 空间 。 
第 一 个 是 默认 的 命名 空间 (default namespace)， 用 语句 “xmlns=” 进 行 声明 。 自 然 地 ， 每 一 
个 开始 标记 都 只 能 定义 一 个 默认 命名 空间 ， 这 不 仅 是 由 默认 命名 空间 的 语义 决定 的 ， 而 且 因 
为 同一 个 开始 标记 中 的 同名 属性 只 能 有 一 个 。 语 名 xmlns:toy=declaration， 定 义 了 第 二 个 命名 
空间 ， 它 由 前 纺 toy 确 定 。 可 以 定义 不 同 前 级 的 命名 空间 ， 只 要 这 些 前 级 是 不 同 的 即 可 9。 

昌 ”W3C 最 后 确定 的 文档 一 般 称 为 “建议 书 ”， 但 事实 上 ， 人 们 都 把 这 些 建议 书 作为 标准 。 


全 ”然而 ， 当 且 仅 当 两 个 标记 的 前 级 指向 相同 URI (相同 意味 着 URI 中 的 字符 囊 完全 相同 ) 时 ， 处 理 器 会 认为 
它们 属于 同一 个 命名 空间 (即使 它们 有 不 同 的 前 缀 )。 
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命名 空间 的 声明 
属于 命名 空间 http://www.acmeinc.com/jp#toys 的 元 素 都 应 该 以 toy: 为 前 级 。 本 例 中 ， 它 们 
是 内 部 标记 toy:item 和 toy:name， 而 没有 前 绥 的 标记 (外 部 的 item、name 和 feature ) 被 认为 属 
于 默认 命名 空间 。 
命名 空间 有 一 个 作用 范围 ， 就 像 颈 套 的 程序 模块 一 样 。 为 了 解释 这 个 问题 ， 我 们 来 看 看 
下 面 的 例子 : 
<item xmlns="http://www.acmeinc.com/jp#supplies" 
xmlns:toy="http://www.acmeinc.com/jp#toys"> 
<name>backpack</name> 
<feature> 
<toy:item> 
<toy :name>cyberpet</toy : name> 
</toy:item> 
</feature> 
<item xmlns="http://www.acmeinc.com/jp#supplies2" 
xmlns:toy="http://www.acmeinc.com/jp#toys2"> 
<name>notebook</name> 
<toy :name>sticker</toy : name> 
</item> 
</item> 
其 中 ， 我 们 为 最 外 层 元 素 item 增 加 了 一 个 子 元 素 ， 这 个 子 元 素 也 叫做 item， 但 它 有 自己 的 默认 
命名 空间 以 及 重新 声明 的 命名 空间 前 缀 toy。 所 以 ， 最 外 层 的 item 标 记 属 于 默认 命名 空间 
http://www.acmeinc.com/jp#supplies. 
内 部 无 前 级 标 记 item 及 其 无 前 级 的 子 标记 name 都 在 默认 命名 空间 http://www.acmeinc.com/ 
jp#supplies2 的 作用 范围 内 。 
同样 ，feature 元 素 的 内 部 标记 toy:item 和 item:name 属 于 命名 空间 http://www.acmeinc.com/ 
jp#toys. 
而 子 元 素 item 的 子 元 素 toy:name 的 命名 空间 则 是 http://www.acmeinc.com/jp#toys2。 
我 们 注意 到 ， 正 像 最 内 层 声明 的 默认 命名 空间 会 覆盖 最 外 层 声 明 的 默认 命名 空间 一 样 ， 
最 内 层 的 前 组 toy 的 声明 会 覆盖 最 外 层 同 样 的 前 级 。 能 识别 命名 空间 的 XML 处 理 器 应 该 明白 这 
些微 妙 之 处 。 特 别 地 ， 这 两 个 没有 前 组 的 元 素 item 和 name 是 不 同 的 标记 ， 因 为 它们 属于 不 同 
的 命名 空间 (对 带 有 前 缀 名 的 标记 name 也 一 样 ) 。 不 识别 命名 空间 的 XML 处 理 器 也 能 解析 上 
述 文档 ， 但 它 会 认为 所 有 没有 前 缀 的 item 和 name 是 一 样 的 ， 而 所 有 出 现 的 有 前 缀 的 标记 
toy:name 是 一 样 的 。 它 仅仅 会 对 名 字 中 奇怪 的 “:” 符 号 感到 困惑 。 
尽管 命名 空间 的 概念 似乎 得 到 了 广泛 的 认同 〈 可 能 有 人 不 狗 同 )， 但 它 却 成 为 W3C 提 出 的 
最 令 人 费解 的 建议 之 一 [Bourret 2000]。 每 个 人 都 赞同 标记 名 应 该 分 成 两 个 部 分 ， 但 人 们 总 想 
找 出 建议 中 的 不 足 。 最 令 人 费解 的 一 点 就 是 使 用 URL 作 命名 空间 。 以 我 们 的 日 常 经 验 而 言 ， 
URL 指 的 是 一 些 Web 资 源 ， 如 果 URL 被 用 作 命名 空间 ， 人 们 很 可 能 将 它 理解 为 一 个 包含 描述 
对 应 名 字 集 的 模式 的 真正 的 Web 地 址 。 实 际 上 ， 命 名 空间 的 名 字 仅仅 是 一 个 碰巧 是 URIL 的 字 
符 串 ， 如 果 将 浏览 器 指向 这 样 的 URL 而 引出 一 个 错误 信息 ， 那 么 会 令 人 非常 失望 。 
使 用 命名 空间 的 最 初 目的 是 建立 一 种 区 分 标记 名 字 的 机 制 。 读 取 用 命名 空间 编码 的 文档 
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的 XML 处 理 器 应 该 知道 如 何 解析 它 ， 换 言 之 ， 就 是 知道 如 何 发 现 它 的 模式 (以 DTD 或 XML 
Schema 来 表示 ，XMEL Schema 是 后 面 介绍 的 一 种 规范 语言 )。 模 式 的 位 置信 息 可 以 在 一 个 特殊 
属性 中 给 出 ， 或 是 特定 的 企业 、 领 域 的 习惯 作法 的 一 部 分 。 举 个 例子 ， 玩 具 行 业 可 能 完成 将 
所 有 和 玩具 相关 的 XML 文档 都 用 位 于 某 个 UREL 的 PTD 来 解析 。 目 前 的 习惯 作法 是 用 某 些 “ 熟 
知 ” 的 命名 空间 来 识别 某 些 词汇 (如 那些 用 于 XML Schema 规范 的 单词 ， 见 17.3 节 )， 这 些 命 
名 空间 可 以 唯一 地 指示 出 文档 模式 。 


17.2.4 文档 类 型 定义 


作者 必须 遵循 一 些 固定 的 规则 来 创立 XML 文 档 ， 以 便 这 些 文档 能 在 浏览 器 中 正确 地 表示 
出 来 。 比 如 说 ， 元 素 table 不 能 出 现在 元 素 form 中 。 而 在 XML 中 ， 作 者 能 够 为 任何 文档 指定 这 
样 的 规则 ， 这 就 使 得 XML 可 以 用 于 描述 各 种 文档 类 型 ， 如 账单 、 目 录 和 订单 等 ， 它 们 一 般 用 
于 机 器 处 理 ， 而 不 是 用 于 人 工 处 理 。 

创建 XML 文档 时 应 该 遵守 的 规则 集 叫 做 文档 类 型 定义 (Document Type Definition, DTD). 
DTD 可 以 指定 为 XML 文档 的 一 部 分 ， 也 可 以 在 文档 中 给 出 能 够 找到 其 DTD 的 URL。 符 合 自己 
的 DTD 的 XML 文档 被 认为 是 正确 的 (valid)。XML 规 范 并 不 要 求 XML 处 理 器 检查 每 一 篇 文档 
是 否 都 遵循 自己 的 DTD ， 因 为 有 些 应 用 程序 可 能 并 不 关心 XML 文档 是 否 正确 。 在 某 些 情况 下 ， 
处 理 器 并 不 检查 文档 的 正确 性 ， 而 是 依赖 于 文档 的 发 送 者 〈 如 在 电子 账单 传递 中 ， 传 送 双方 
使 用 的 软件 能 保证 产生 的 是 正确 的 文档 )。XML 其 至 不 要 求 文 档 必 须 有 DTD， 但 却 要 求 所 有 
的 XML 文档 必须 都 具备 形式 良好 性 (形式 良好 的 条 件 ， 即 正确 的 元 素 媒 套 与 属性 约束 ， 已 在 
17.2.2 节 中 进行 了 讨论 )。 

上 述 关 于 正确 性 的 两 个 说 明 可 以 使 XML 处 理 器 得 到 明显 的 简化 ， 并 使 处 理 器 加 快 处 理 速 
度 。HTML 浏 览 器 总 是 尽量 纠正 HTML 文 档 中 的 bug ， 并 尽 可 能 地 把 文档 中 的 bug 报 告 出 来 。 
而 XML 处 理 器 却 只 是 要 求 拒绝 那些 形式 不 好 的 文档， 而 要 求 XML 文档 必须 正确 的 处 理 器 则 根 
本 不 会 处 理 那些 不 符合 DTD 的 文档 , ,即便 它们 是 形式 良好 的 文档 。 

对 于 熟悉 形式 语言 的 人 来 说 ，DTD 就 是 在 (定义 ) 文档 的 标记 与 属性 基础 上 指定 合法 
XML 文档 的 语法 。 下 面 就 是 图 17-3 的 文档 对 应 的 DTD: 

<!DOCTYPE PersonList [ 

<!ELEMENT PersonList (Title,Contents)> 

<!ELEMENT Title EMPTY> 

<!ELEMENT Contents (Person*)> 

<!ELEMENT Person (Name, Id,Address)> 

<!ELEMENT Name (#PCDATA)> 

<!ELEMENT Id (#PCDATA)> 

<!ELEMENT Address (Number ,Street)> 

<!ELEMENT Number (#PCDATA)> 

<!ELEMENT Street (#PCDATA)> 

<!ATTLIST PersonList Type CDATA #IMPLIED 
Date CDATA #IMPLIED> 

<!ATTLIST Title Value CDATA #REQUIRED> 

]> 

这 个 例子 中 ， 我 们 可 以 看 到 最 常见 的 DTD 组 件 : GR ( 例 中 是 PersonList) 和 一 组 
ELEMENT 和 AITLIST 语 句 。DTD 的 名 字 必 须 和 符合 该 DTD 的 XML 文档 的 根 元 素 的 标记 名 一 
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致 。 每 一 个 允许 的 标记 (包括 根 标记 ) 有 一 个 ELEMENT 语 句 。 此 外 ， 对 于 每 一 个 可 以 有 自己 
属性 的 标记 来 说 ，ATTLIST 语 句 指定 允许 的 属性 和 它们 的 类 型 。 

本 例 中 ， 第 一 个 ELEMENT 语 句 表示 PersonList 元 素 包含 Title 和 跟随 其 后 的 Contents 元 素 。 
Title 元 素 (第 二 个 ELEMENT 语 句 ) 不 包含 任何 元 素 ( 它 是 空 元 素 )。 而 在 Contents 元 素 的 定 
义 中 ,“*” 表 示 Contents 有 0 个 或 多 个 Person 类 型 的 元 素 。 如 果 不 用 “*” 而 用 “+”， 则 表示 
Contents 至 少 有 1 个 Person 类 型 的 元 素 。 元素 Name、Number 和 Street 都 被 声 明 为 #PCDATA 类 型 ， 
即 它 们 是 字符 串 类 型 。 

在 元 素 列表 之 后 ，DTD 还 包含 允许 的 元 素 属性 的 描述 。 本 例 中 ，PersonList 有 属性 Type 和 
Date， 而 Title 则 只 有 一 个 属性 Value， 其 他 的 元 素 没 有 属性 。 此 外 ，#IMPLIED 指 定 的 
PersonList 的 两 个 属性 都 是 可 选 的 ， 而 织 EQUIRED 则 表明 Title 的 Value 属性 是 必需 的 ， 这 三 个 
属性 的 类 型 都 是 CDATA ， 即 字符 串 类 型 (注意 ， 定 义 元 素 的 字符 串 类 型 和 定义 属性 的 字符 串 
类 型 的 语法 不 一 样 )。 

根据 上 面 的 DTD， 图 17-3 中 的 XML 文 档 是 正确 的 。 但 如 果 我 们 将 文档 中 的 某 个 元 素 
Address 删 除 ， 那 么 它 就 不 正确 了 ， 因 为 DTD 要 求 每 一 个 Person 都 必须 有 一 个 Address。 另 一 方 
面 ， 我 们 也 可 以 上 述 DTD 的 ELEMENT Person 的 声明 改 为 : 


<!ELEMENT Person (Name,Id,Address?)> 


使 得 Address 是 可 选 的 ， 因 为 “?” 指 示 Address 元 素 出 现 0 或 一 次 。 

我 们 也 可 以 声明 在 person 的 描述 中 ， 元 素 的 顺序 是 无 关 紧要 的 。 这 通过 使 用 表示 选择 的 连 
接 符 “| ”实现 ; 

<!ELEMENT Person 


( (Name , Id, Address) | (Name, Address, Id) | (Id, Address, Name) 
| (Id, Name, Address) | (Address , Id,Name) | (Address ,Name ,Id))> 


然而 ， 这 样 非常 不 方便 。 

DTD 人 允许 作者 为 一 个 属性 指定 多 种 类 型 ， 我 们 已 经 看 到 了 CDATA ， 其 他 经 常 使 用 的 类 型 
是 与 图 17-4 的 报告 文档 相关 的 ID、IDREF 和 IDREFS。 我 们 指出 这 种 类 型 的 文档 需要 满足 参照 
完整 性 ， 就 像 第 4 章 中 给 出 的 数据 库 示例 一 样 。 

特别 地 ， 我 们 希望 确保 Student 的 属性 StudId 的 值 和 Course 的 属性 CrsCode 的 值 在 整个 文档 
范围 内 具有 唯一 性 ， 确 保 CrsTaken 中 的 属性 CrsCode 引 用 同一 文档 中 的 课程 (通过 Course 的 
CrsCode 属 性 值 的 匹配 ) ， 并 确保 由 ClassRoster 的 属性 Members 说 明 的 列表 成 员 引 用 同一 文档 
中 给 出 的 Student 记 录 (同样 通过 StudId 和 Members 的 值 匹配 来 实现 )， 图 17-5 的 DTD 用 于 达到 
这 一 和 目的， 这 里 忽略 了 那些 容易 推 想 出 的 部 分 。 

要 求 文档 正确 性 的 XML 处 理 必 须根 据 该 DTD 的 要 求 来 确保 不 存在 两 个 Student 元 素 的 
StudId 属 性 具有 相同 的 值 (Course 元 素 也 一 样 ) 。 。 这 是 因为 这 些 属 性 被 声明 为 ID 类 型 。 同 样 
地 ， 元 素 CrsTaken 的 属性 CrsCode 定 义 为 IDREF， 因 此 保持 了 参照 完整 性 。ClassRoster 的 属性 
Members 定 义 为 IDREFS 类 型 ， 即 表示 IDREF 类 型 值 的 列表 。 该 声明 是 为 了 保证 对 学 生 Id 的 参 
照 完整 性 。 


O PCDATA 表 示 已 解析 的 字符 串 。 
© 事实 上 ， 还 要 保证 一 个 更 严格 的 条 件 ， 即 Student 元 素 的 属性 StudId 和 Course 元 素 的 属性 CrsCode 的 值 不 能 相同 。 
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<!DOCTYPE Report [ 
<!ELEMENT Report (Students ,Classes ,Courses)> 
<!ELEMENT Students (Student*)> 
<1FLEMENT Classes (Class*)> 
<!ELEMENT Courses (Course*)> 
<!ELEMENT Student (Name,Status,CrsTaken*)> 
<!ELEMENT Name (First,Last)> 
<!ELEMENT First (#PCDATA)> 


<!ELEMENT CrsTaken EMPTY> 
<!ELEMENT Class (CrsCode,Semester,ClassRoster)> 
<!ELEMENT Course (CrsName)> 


<!ELEMENT ClassRoster EMPTY> 

<!ATTLIST Report Date #IMPLIED> 

<!ATTLIST Student StudId ID #REQUIRED> 
<!ATTLIST Course CrsCode ID #REQUIRED> 
<!ATTLIST CrsTaken CrsCode IDREF #REQUIRED> 
<!ATTLIST CrsTaken Semester IDREF #REQUIRED> 
<!ATTLIST ClassRoster Members IDREFS #IMPLIED> 





图 17-5 图 17-4 中 报告 文档 的 DTD 
在 文档 中 还 有 一 些 要 求 注 意 ， 但 又 不 能 通过 DTD 强 制 执行 的 约束 ， 我 们 将 在 下 一 节 讨 论 
这 些 问题 。 


17.25 DTD 作 为 数据 定义 语言 的 不 足 


XML 被 认为 是 SGML[SGM1986] 的 一 种 简化 版 本 ，SGML 在 XML 开始 使 用 的 数 年 前 就 已 
经 成 为 了 标准 。SGML 语 言 用 来 指定 可 交换 且 能 被 软件 代理 自动 处 理 的 文档 ， 这 也 是 XML 最 
初 的 目标 。DTD 及 其 使 用 的 基本 原理 都 借鉴 于 SGML。 众 所 周知 ，XML 的 技术 基础 来 自 于 形 
式 语言 理论 和 通用 (语法 ) 分 析 算 法 ,分 析 算 法 能 够 验证 任意 给 定 的 文档 是 否 遵守 DTD。 这 
种 验证 对 文档 处 理 软 件 具 有 重要 意义 。 例 如 ， 如 果 XML 处 理 器 希望 它 接收 的 文档 经 过 验证 ， 
并 符合 上 述 Report DTD ， 它 就 不 需要 考虑 那些 特殊 或 例外 情况 ， 如 某 个 学 生 可 能 选修 了 并 不 
存在 的 一 门 课程 或 者 丢失 了 一 条 街道 的 地 址 。 

XML 还 在 发 展 之 中 ， 新 的 方法 正在 出 现 。 特 别 是 XML 给 出 了 这 样 一 种 可 能 性 ， 把 Web 文 
档 作 为 一 种 可 以 查询 的 数据 源 (如 同 数 据 库 中 的 关系 )、 并 且 通 过 具有 语义 含义 的 链接 使 之 联 
系 起 来 (如 同 外 键 约束 )。 在 这 点 上 ，XML 超 越 了 它 所 借鉴 的 GML。 由 于 出 现 的 太 晚 而 没有 
包含 在 XML 1.0 中 的 命名 空间 的 概念 是 XML 的 第 一 次 扩展 ， 而 更 有 意义 的 扩展 是 发 展 出 了 
XML Schema 规范 (下 一 节 介 绍 )，XML Schema 是 为 了 克服 作为 数据 定义 语言 的 DTD 的 许多 
不 足 之 处 而 开发 出 来 的 。 这 些 不 足 之 处 如 下 : . 

* DTD 中 没有 用 到 命名 空间 的 概念 。DTD 认 为 xmins 与 其 他 的 属性 一 样 ， 并 没有 特别 的 意 

思 。 虽 然 扩 展 DTD 以 包含 命名 空间 并 不 难 ， 但 这 样 就 存在 反 向 兼容 性 的 问题 ， 考 虑 到 
DTD 的 其 他 限制 ， 这 种 扩展 可 能 实际 上 并 没有 什么 作用 。 
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。DTD 的 语法 和 XML 文档 的 语法 有 很 大 的 差别 。 虽 然 这 并 不 是 什么 致命 的 缺点 ， 但 也 不 
是 XML 1.0 中 好 的 特性 。 

。DTD 有 一 个 非常 有 限 的 基本 类 型 指令 系统 (本 质 上 仅仅 是 字符 串 ) 。 

。DTD 提 供 的 表达 数据 一 致 性 约束 的 手段 有 限 。 没 有 键 (除了 非常 有 限 的 ID 类 型 )， 并 且 
指定 参照 完整 性 的 机 制 非常 弱 。 唯 一 一 种 进行 引用 的 方法 是 通过 IDPREF 和 IDREFS 属 性 ， 
即使 这 种 引用 只 能 基于 一 种 基本 类 型 一 一 申 。 特 别 地 ， 不 能 指定 引用 的 类 型 。 不 能 指定 
图 17-4 的 报告 文档 中 的 元 素 CrsTaken 的 属性 CrsCode 只 能 引用 Course 元 素 。 因 此 ，John 
Doe 可 能 会 有 一 个 子 元 素 

<CrsTaken CrsCode="666666666" Semester="F1999"/> 

它 引用 的 是 Joe Public 的 学 生 ID 而 不 是 一 门 课程 ， 并 且 任 何 遵循 XML 1.0 的 处 理 器 都 不 
会 检测 出 这 个 问题 。 

DTD 拥 有 强制 执行 属性 的 参照 完整 性 的 途径 ， 但 元 素 却 缺乏 相应 的 特性 。 例 如 ， 元 素 
Class 的 内 容 包含 子 元 素 CrsCode 和 Semester (不 要 和 标记 CrsTaken 的 属性 混淆 )。 显 然 ， 
我 们 希望 元 素 CrsCode 的 内 容 能 引用 一 门 有 效 的 课程 ， 并 和 某 些 Course 的 属性 CrsCode 的 
值 相 匹配 。 而 且 ， 对 于 元 素 CrsTaken 的 每 一 对 属性 值 ， 在 某 些 Class 元 素 中 必须 有 与 之 对 
应 的 CrsCode/Semester 标 记 对 。 而 这 些 约束 无 法 使 用 DTD 来 强制 执行 。 

XML 数据 是 有 序 的 ， 而 数据 库 的 数据 是 无 序 的 (如 元 组 之 间 的 顺序 就 无 关 紧 要 )。 同 样 ， 
数据 库 关 系 或 对 象 的 属性 之 间 的 顺序 也 无 关 紧 要 ， 但 XML 的 元 素 之 间 的 顺序 是 有 意义 
的 。 我 们 已 经 知道 ，DTD 允 许 指定 不 同 的 组 合 ， 据 此 我 们 可 以 声明 元 素 可 以 无 序 ( 如 前 
面 所 举 的 Person 元 素 的 Name、Address、Id 子 元 素 的 例子 )。 但 是 ， 当 属性 数量 很 多 时 ， 
这 种 方法 就 变 得 非常 不 方便 。 例 如 ， 为 了 说 明 N 个 子 元 素 可 以 无 序 ， 我 们 必须 指出 N! 个 
可 能 的 组 合 。 

元 素 定 义 对 于 整个 文档 具有 全 局 性 。 例 如 ， 某 个 DTD 中 指定 了 一 个 Name 元 素 ， 它 有 
First 和 Last 两 个 子 元 素 ， 那 么 在 这 个 文档 中 ， 就 不 能 定义 一 个 名 字 同 样 为 Name 但 结构 不 
同 的 元 素 。 这 是 因为 ，DTD 中 的 每 一 个 元 素 名 只 能 有 一 个 ELEMENT 子 句 。 无 法 根据 父 
元 素来 局 部 化 Name， 以 便 根据 Name 出 现 的 位 置 的 不 同 而 应 用 不 同 的 定义 。 


17.3 XML Schema 


XML Schema 是 XML 文档 的 一 种 数据 定义 语言 ， 它 已 经 成 为 W3C 组 织 推荐 的 一 个 标准 。 
为 了 克服 前 述 的 DTD 机 制 的 不 足 ， 人 们 提出 并 发 展 了 Schema， 它 具有 以 下 主要 特征 : 

“其 语法 和 一 般 XML 文 档 的 语法 一 致 。 

。 它 结合 了 命名 空间 的 机 制 。 特 别 地 ， 不 同 的 模式 可 以 从 不 同 的 命名 空间 中 导入 并 合成 一 

个 模式 。 

。 它 提供 了 许多 内 置 的 数据 类 型 ， 如 字符 串 、 整 型 和 时 间 型 ， 这 类 似 于 SQL 中 的 类 型 。 

。 它 提供 了 通过 简单 数据 类 型 定义 复杂 数据 类 型 的 方法 。 

。 允许 为 不 同 代 套 结构 的 元 素 定义 相同 的 元 素 名称 。 

。 支 持 键 和 参照 完整 性 约束 。 
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。 对 于 元 素 类 型 的 顺序 无 关 紧 要 的 文档 ， 它 提供 了 一 种 更 好 的 定义 机 制 。 

遵从 某 个 模式 的 XML 文档 被 称 为 模式 有 效 (schema valid) 的 文档 ， 并 且 该 文档 叫做 该 横 
式 的 一 个 实例 (instance) 。 。 和 DTD 相 似 的 是 ，XML Schema 规范 并 不 要 求 XML 处 理 器 真正 
处 理 文档 的 模式 。 处 理 器 也 可 以 选择 忽略 文档 的 模式 或 者 使 用 一 个 不 同 的 模式 。 例 如 ，XML 
处 理 器 可 能 只 考虑 能 够 更 好 地 遵守 给 定 的 参照 完整 性 约束 的 文档 ， 或 者 可 能 只 要 求 执行 模式 
的 一 部 分 。 这 一 宽松 的 特点 和 数据 库 的 不 一 样 ， 数 据 库 要 求 所 有 的 数据 必须 满足 数据 库 的 模 
式 。 从 这 个 意义 上 来 说， 尽管 模式 可 能 描述 了 部 分 XML 文档 ， 但 XML 数据 从 整体 上 来 说 是 半 
结构 化 的 (参见 17.1 节 )。 


17.3.1 XML Schema 和 命名 空间 


一 个 XML Schema 文档 (和 DTD 一 样 ) 是 用 来 描述 其 他 XML 文 档 (实例 ) 的 结构 的 。 
Schema 文档 是 以 模式 中 使 用 的 相关 命名 空间 的 声明 开头 ， 其 中 有 三 个 命名 空间 非常 重要 。 

e http://www.w3.org/2001/XMLSchema: 该 命名 空间 规定 了 在 模式 中 用 到 的 标记 和 属性 的 
名 字 。 这 些 名 字 不 和 该 模式 的 任何 特定 文档 (XML 文档 ) 相关 ， 也 不 出 现在 该 模式 的 
任何 具体 的 文档 中 。 相 反 ， 它 们 用 于 从 总 体 上 描述 XML 文档 的 结构 属性 。 实 际 上 ， 在 
http://www.w3.org/2001/XMLSchema 中 可 能 根本 就 没有 文档 。 该 命名 空间 的 名 字 能 被 所 
有 利用 XML 处 理 器 的 模式 识别 ， 并 被 认为 是 XML Schema 规范 中 定义 的 名 字 。 例 如 ， 与 
该 命名 空间 有 关 的 名 字 有 schema、attribute 和 element， 这 些 名 字 并 不 会 像 图 17-4 那 样 出 
现在 实例 文档 中 〈 如 果实 例文 档 真 的 包含 了 这 几 个 名 字 ， 那 么 它们 不 是 用 来 描述 文档 结 
构 的 ， 含 义 也 不 同 ， 且 应 该 属于 另 一 个 命名 空间 )。 因 此 ， 这 个 命名 空间 确实 是 模式 文 
档 的 一 部 分 ， 但 不 能 出 现在 实例 文档 中 。 

* http://www.w3.0rg/2001/XMLSchema-instance: 和 http://www.w3.org/2001/XMLSchema 
相 联 的 另 一 个 命名 空间 ， 它 规定 了 一 些 特殊 的 名 字 ， 这 些 名 字 在 XML Schema 规范 中 定 
义 ， 不 过 这 些 名 字 在 实例 文档 中 使 用 ， 而 不 是 在 它们 的 模式 中 使 用 (因此 该 命名 空间 的 
名 字 时 作 XMLSchema-instance)。 例 如 ， 名 字 schemaLocation 表 示 的 是 XML 文档 中 模式 
所 在 位 置 。 另 一 个 名 字 定 义 了 文档 中 的 空 值 。 在 用 到 这 个 功能 时 ， 我 们 会 向 大 家 介绍 这 
些 特 性 。 这 个 命名 空间 是 实例 文档 规范 的 一 部 分 。 

“ 目标 命名 空间 : 规定 了 一 个 特定 的 模式 文档 所 定义 的 一 组 名 字 ， 换 名 话说 ， 是 一 组 用 户 
定义 的 名 字 ， 这 些 名 字 用 于 那个 特定 模式 的 实例 文档 。 比 如 ， 在 图 17-4 的 模式 文档 中 ， 
名 字 CrsTaken、Student、Status 等 等 就 可 以 和 目标 命名 空间 联系 在 一 起 ( 下 文中 我 们 会 
介绍 模式 的 各 个 部 分 )。 我 们 通过 模式 文档 的 根 元 素 schema 的 开始 标记 的 属性 
targetNamespace 来 声明 目标 命名 空间 。 

DTD 的 一 个 主要 缺陷 就 是 不 能 整合 命名 空间 : 虽然 DTD 可 以 定义 任意 数量 的 标记 ， 但 却 不 能 
将 这 些 标记 和 某 个 命名 空间 关联 起 来 。 

现在 我 们 开始 为 图 17- 《4 的 报告 文档 开发 与 之 匹配 的 模式 。 在 第 一 个 例子 中 ， 我 们 只 声明 

模式 中 要 用 到 的 命名 空间 。 


O 注意 ,这 里 所 说 的 模式 和 实例 与 关系 数据 库 和 面向 对 象 数据 库 中 的 术语 模式 和 实例 类 似 。 
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<schema xmlns="http: //www.w3.org/2001/XMLSchema" 
targetNamespace="http://xyz.edu/Admin"> 


<!-- 现在 这 里 是 空 的 --> 

</schema> 
本 例 中 ， 首 先 将 标准 命名 空间 XMLSchema 声 明 为 默认 的 命名 空间 。 这 样 做 是 便捷 的 ， 因 为 在 
创建 模式 时 ， 我 们 需要 使 用 到 许多 XML Schema 规范 中 定义 的 特殊 标记 ， 将 XMLSchema 定 义 
为 默认 命名 空间 可 以 避免 在 使 用 这 些 标记 时 加 上 命名 空间 的 前 级 。 如 果 希 望 将 另 一 个 命名 空 
间 设 置 为 默认 命名 空间 ， 那 么 我 们 可 以 使 用 以 下 语句 : 

xmlns:xsd="http: //www.w3.org/2001/XMLSchema" 

根据 约定 ，xsd 是 XMLSchema 命 名 空间 中 所 有 名 字 的 前 级 ， 不 过 该 约 定 不 是 强制 的 。 当 
声明 xsd 作 为 XMLSchema 命 名 空间 中 名 字 的 前 绥 时 ， 只 要 使 用 该 命名 空间 中 的 标记 就 要 加 上 
前 级 xsd， 如 下 例 所 示 : 

<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" 

xsd:targetNamespace="http://xyz.edu/Admin"> 


<!-- 现在 这 里 是 空 的 --> 
</xsd: schema> 
这 里 的 第 一 个 属性 表示 和 命名 空间 XMLSchema 相 关 的 名 字 的 前 级 是 xsd。 第 二 个 属性 声明 上 
述 模式 文档 中 定义 的 新 标签 和 新 属性 属于 命名 空间 http://xyz.edu/Admin 。 注 意 ， 因 为 
targetNamespace 是 由 XML Schema 规范 定义 的 ， 所 以 它 的 前 缀 是 xsd。 


<!-- 一 个 XML 模式 文档 ; 位 于 http://xyz.edu/Admin.xsd --> 
<schema xmlns="http://www.w3.org/2001/XMLSchema“ 
targetNamespace="http://xyz-.edu/Admin"> 


<!-- 现在 这 里 是 空 的 --> 


</schema> 


<!-- 符合 上 述 模式 的 实例 文档 ; 它 使 用 了 上 述 模式 中 定义 的 目标 命名 空间 --> 


<?xml version="1.0" ?> 

<Report xmlns="http://xyz.edu/Admin” 
xmlns:xsi="http: //www.w3.org/2001/XMLSchema~instance" 
xsi:schemaLocation="http://xyz.edu/Admin 
http: //xyz.edu/Admin.xsd"> 


<!-- 和 图 17-4 的 报告 文档 的 内 容 相同 --> 
</Report> 





图 17-6 模式 和 实例 文档 


假如 我 们 已 经 填 满 了 上 述 模式 中 的 空缺 部 分 ， 那 么 构造 遵从 该 模式 的 XML 文 档 (图 17-4 
中 的 文档 ) 时 ， 该 做 那些 事情 呢 ? 我 们 需要 在 实例 文档 中 添加 三 项 内 容 : 声明 它 使 用 的 命名 
空间 〈 本 例 中 为 http:/xyz.edu/Admin)， 报 告 文档 的 模式 的 位 置 ， 以 及 命名 空间 XMLSchema- 
Instance。 需 要 添加 最 后 一 项 是 因为 实例 文档 中 出 现 属性 schemaLocation， 它 是 属于 命名 空间 
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XMLSchema-instance 的 ， 该 属性 指定 了 模式 的 位 置 。 为 了 更 好 地 理解 模式 、 实 际 的 实例 文档 
和 各 种 命名 空间 之 间 的 关系 ， 我 们 在 图 17-6 中 同时 给 出 了 报告 文档 和 它 遵 循 的 模式 。 

可 以 看 到 ， 图 中 实例 文档 的 默认 命名 空间 是 http://xyz.edu/Admin， 它 是 模式 文档 中 属性 
targetNamespace 所 定义 的 命名 空间 ? 。 在 这 个 URL 中 可 以 不 存在 任何 内 容 ， 因 为 命名 空间 只 
是 用 于 消除 文档 标记 名 和 属性 的 歧义 的 标识 符 。 因 为 图 17-6 中 的 文档 和 图 17-4 中 的 报告 文档 
的 内 容 一 致 ， 大 多 数 的 标记 和 属性 名 属于 这 个 命名 空间 ， 所 以 选 它 作为 默认 命名 空间 可 以 最 
大 限度 减少 文档 中 前 级 的 使 用 。 

属性 xsi:schemalocation 是 XML Schema 规范 的 一 部 分 ， 属 于 命名 空间 
http://www.w3.0rg/2001/XMLSchema-instance。 该 属性 的 值 是 一 个 命名 空间 -URL 对 ， 这 表明 
命名 空间 http://xyz.edu/Admin 的 模式 文档 可 以 在 URL http://xyz.edu/Admin.xsd 所 指 的 XML 模 
式 文 档 中 找到 。 然 而 ， 正 如 前 面 提 到 的 那样 ， XML 处 理 器 并 不 受 这 些 限 制 。 它 们 可 以 忽略 这 
个 模式 ， 也 可 以 使 用 另 一 个 模式 。 

在 具体 讲解 如 何 定 义 模式 之 前 ， 我 们 来 看 另 一 个 重要 的 细节 ， 这 就 是 include 语 句 。 从 图 
17-4 中 我 们 可 以 看 到 ， 图 中 的 XML 文 档 有 三 个 不 同 的 部 分 : 学生 列 表 、 班 级 列表 和 课程 列表 。 
因为 每 个 部 分 的 结构 都 很 不 一 样 ， 所 以 假设 它们 单独 出 现在 其 他 上 下 文中 并 拥有 自己 的 模式 
也 是 合理 的 。 鉴 于 这 一 点 ， 仅 仅 为 了 创建 图 17-4 的 文档 的 模式 ， 而 将 它们 各 自 的 模式 全 部 搂 
贝 过 来 就 不 合理 了 。 我 们 可 以 使 用 XML Schema 规范 中 定义 的 include 语 句 来 解决 这 个 问题 : 

<schema xmlns="http://www.w3.org/2001/XMLSchema" 


targetNamespace="http://xyz.edu/Admin"> 


<include schemaLocation="http://xyz.edu/StudentTypes.xsd"/> 
<include schemaLocation="http://xyz.edu/ClassTypes.xsd"/> 
<include schemaLocation="http://xyz.edu/CourseTypes.xsd"/> 


<!-- Nothing here yet --> 
</schema> 


include 语 名 的 作用 就 是 将 给 定 文档 的 指定 地 址 的 模式 包含 进来 。 这 一 技术 使 XML 模式 更 
灵活 以 及 模块 化 程度 更 高 。 被 包含 进来 的 模式 文档 必须 和 包含 它 的 模式 文档 有 具有 同一 个 目标 
命名 空间 。 上 例 可 能 还 有 一 个 容易 混淆 的 地 方 ， 属 性 schemaLocation 并 没有 使 用 xsi 前 级 ， 而 
且 和 前 面 例子 不 同 的 是 ， 它 没有 把 命名 空间 XMLSchema-instance 包 含 进来 。 这 样 做 是 有 道理 
的 。 标 记 include 的 属性 SchemaLocation 是 属于 标准 XMLSchema 命 名 空间 的 (就 像 include 本 身 
一 样 )。 也 就 是 说 ， 这 个 属性 和 前 面 的 报告 文档 中 的 同名 属性 是 两 个 不 同 的 属性 。 和 报告 文档 
不 一 样 的 是 ， 这 里 的 模式 文档 不 需要 使 用 XMLSchema-instance 命 名 空间 中 的 名 字 ， 所 以 这 个 
命名 空间 就 不 需要 声明 。 


17.3.2 简单 类 型 


1. 基本 类 型 
缺少 基本 类 型 是 DTD 一 大 缺陷 。 为 了 克服 这 一 缺陷 ， 除 string、ID 和 IDREF 之 外 ，XML 


O ”本 例 中 使 用 的 大 部 分 命名 空间 的 位 置 和 文档 位 置 都 不 是 真实 的 ， 这 是 为 了 保护 那些 真实 位 置 上 的 信息 。 然 
而 XMLSchema 和 XMLSchema-instance 这 个 命名 空间 是 真实 的 。 
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Schema 规范 增加 了 许多 有 用 的 基本 类 型 ， 如 decimal、integer、float、boolean 和 date。 更 重要 
的 是 , 它 提供 类 型 构造 器 ， 如 list 和 union, 并 且 可 以 根据 已 有 的 基本 类 型 构造 出 新 的 基本 类 型 ， 
这 一 机 制 和 SQL 中 的 CREATE DOMAIN 语 名 相似 (参见 4.3.6 节 )。 

2. 使 用 list 和 union 构 造 器 构造 简单 类 型 

注意 ,正如 在 DTD 中 一 样 ，IDREFS 并 不 是 一 种 基本 类 型 。 下 面 展 示 了 如 何 使 用 list 构 造 
器 构造 该 类 型 。 

<simpleType name="myIdrefs"> 

<list itemType="IDREF" /> 

</simpleType> 

若 需要 以 两 种 或 更 多 种 方式 输入 数据 ， 那 么 可 以 使 用 union 类 型 。 举 个 例子 ， 美 国 的 电话 
号 码 可 以 是 7 位 也 可 以 是 10 位 ， 这 可 用 以 下 方法 来 表示 : 


<simpleType name="phoneNumber"> 
<union memberTypes="phone7digits phonel0digits"/> 
</simpleType> 


马上 我 们 会 给 出 类 型 phone7digits 和 phonel0digits 的 定义 。 
3. 使 用 限制 来 构造 简单 类 型 
构造 新 类 型 的 一 个 更 有 意思 的 方法 是 使 用 限制 (restriction) 机 制 ， 这 种 机 制 使 得 我 们 可 
以 使 用 固定 的 指令 系统 中 一 条 或 多 条 约束 来 限制 基本 类 型 ， 该 指令 系统 在 XML Schema 规范 中 
定义 。 我 们 就 是 这 样 定 义 类 型 phone7digits 的 : 
<simpleType name="phone7digits"> 
<restriction base="integer"> 
<minInclusive value="1000000"/> 
<maxInclusive value="9999999" /> 
</restriction> 
</simpleType> 
可 以 用 类 似 方 法 定义 10 位 数字 类 型 。 在 phone7digits 的 定义 中 ， 我 们 使 用 了 标记 maxInclusive 
和 minInclusive 来 定义 正确 的 数值 范围 。XML Schema 提 供 了 大 量 的 内 置 约束 ， 如 
maxInclusive/minInclusive ， 这 些 内 置 约 束 可 以 和 [XMLSchema2000a, XMLSchema2000b] 一 
起 使 用 。 这 里 我 们 只 介绍 几 个 比较 常见 的 内 置 约束 。 另 外 ， 如 果 人 允许 用 户 以 XXX-YYYY 的 格 
式 自己 指定 电话 号 码 ， 那 么 可 以 通过 几 种 方法 来 实现 ， 下 面 给 出 其 中 的 一 种 方法 : 
<simpleType name="phone7digitsAndDash"> 
<restriction base="string"> 
<pattern value=" [0-9] {3}- [0-9] {4}"/> 
</restriction> 
</simpleType> 
这 里 我 们 使 用 pattern 标 记 限制 字符 串 必 须 和 给 定 的 模式 相符 。 构 造 该 模式 的 语言 和 Pen 编程 语 
言 中 用 到 的 是 相似 的 ， 但 只 要 你 热 悉 诸 如 Vi 或 Emacs 等 文本 编辑 器 ， 就 不 会 对 模式 构造 的 基本 
原理 感到 陌生 了 。 在 上 例 中 ，[0-9] 意 味 着 “0 到 9 之 间 的 任何 数字 ”"，{3} 是 一 种 模式 修饰 符 ， 


昌 . 除非 特别 说 明 ， 否 则 所 有 XML Schema 例 子 中 的 默认 命名 空间 都 是 标准 命名 空间 http://www.w3.org/2000/ 
10/XMLSchema. 
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它 意味 着 匹配 的 字符 串 有 且 只 有 三 位 数字 。 

从 基本 类 型 string 构 造 简单 类 型 的 方法 还 有 以 下 几 种 : 

。<length value="7">: 限定 字符 串 长 度 只 能 为 7。 

。<minLength value="7">: 限定 字符 串 长 度 至 少 为 7。 

。<maxLength value="14">: 限定 字符 串 长 度 最 多 为 14。 

e <enumeration value="ABC">: ERER LEI (FERN). 
除 字 符 串 之 外 ， 其 他 类 型 也 可 以 使 用 上 述 限 制 。 事 实 上 ，enumeration 可 以 应 用 于 任何 基本 类 
型 ， 下 面 就 是 一 个 这 样 的 例子 : 


<simpleType name="emergencyNumbers"> 
<restriction base="integer"> 
<enumeration value="911"/> 
<enumeration value="333"/> 
<enumeration value="5431234"/> 
</restriction> 
</simpleType> 


4. 报告 文档 中 的 简单 类 型 

现在 我 们 为 图 17-4 的 报告 文档 定义 一 些 简单 类 型 。 后 面 我 们 会 将 这 些 类 型 和 文档 模式 中 
适当 的 属性 联系 起 来 。 为 了 便于 引用 ， 我 们 将 所 有 与 学 生 相关 的 类 型 归纳 在 图 17-8 中 ， 所 有 
和 课程 相关 的 类 型 归纳 在 图 17-9 中 。 


<simpleType name="studentId"> 
<restriction base="ID"> 
<pattern value=" [0-9] {9}"/> 
</restriction> 
</simpleType> 
<simpleType name="studentRef"> 
<restriction base="IDREF" 
<pattern value=" [0-9] {9}"/> 
</restriction> 
</simpleType> 
<simpleType name="studentIds"> 
<list itemType="studentRef"/> 
</simpleType> 
<simpleType name="courseCode"> 
<restriction base="ID"> 
<pattern value=" [A-Z] {3} [0-9] {3}"/> 
</restriction> 
</simpleType> 
<simpleType name="courseRef"> 
<restriction base="IDREF"> 
<pattern value=" [A-Z] {3} [0-9] {3}"/> 
</restriction> 
</simpleType> 


第 一 个 类 型 studId 将 学 生 Id 定 义 为 长 度 为 9 的 数字 字符 串 ， 该 类 型 用 于 描述 报告 文档 中 
studId 的 值 域 。 第 二 个 类 型 定义 了 引用 学 生 Id 的 类 型 ， 第 三 个 类 型 定义 了 引用 学 生 Id 的 列表 ， 
第 四 个 类 型 定义 课程 编码 为 三 个 大 写字 母后 跟 三 位 数字 的 字符 串 ， 第 五 个 类 型 定义 的 是 课程 
的 引用 类 型 。 注 意 ， 我 们 将 ID 和 IDREFS 作 为 基 类 型 ， 它 们 的 语义 和 DTD 中 的 语义 相同 ， 因 而 
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确保 了 唯一 性 和 参照 完整 性 。 

上 面 的 定义 和 图 17-5 中 的 DTD 相 比 ， 已 经 有 了 很 大 的 改进 。 在 DTD 中 不 可 能 说 明 属 性 
Members 返 回 的 是 对 学 生 的 引用 列表 而 不 是 对 课程 的 引用 列表 ， 也 不 可 能 对 标记 CrsTaken 的 
属性 CrsCode 施 加 相似 的 限制 。 相 比较 而 言 ， 上 述 简单 类 型 能 够 避免 这 种 无 意义 的 引用 ， 这 是 
因为 类 型 courseRef 同 studentId 的 值 域 不 相交 ， 类 型 studentRef 同 courseCode 的 值 域 也 不 相交 。 

5. 简单 元 素 和 属性 的 类 型 声明 

到 目前 为 止 ， 我 们 还 没有 谈 到 不 和 元 素 以 及 属性 联系 在 一 起 的 类 型 。 这 里 给 出 了 一 些 简 
单 的 例子 ， 用 于 描述 报告 文档 中 标记 的 类 型 声明 ， 这 些 将 成 为 报告 的 模式 文档 的 一 部 分 : 


<element name="CrsName" type="string"/> 
<element name="Status" type="adm:studentStatus"/> 


第 一 个 声明 表示 元 素 CrsName 的 内 容 是 string 类 型 的 。 最 后 一 个 声明 是 个 假设 ， 将 标记 Status 与 
导出 类 型 studentStatus 相 关联 ，studentStatus 被 定义 成 枚 举 类 型 ， 值 为 字符 串 U1、U2、U3、 
U4、G1、G2、G3、G4 和 G5， 用 以 表示 各 级 本 科 生 和 研究 生 。 


<simpleType name="studentStatus"> 
<restriction base="string"> 
<enumeration value="U1"/> 
<enumeration value="U2"/> 


<enumeration value="G5"/> 
</restriction> 
</simpleType> 
本 例 中 非常 重要 的 一 处 是 studentStatus 的 前 缀 adm，adm 是 因为 考虑 到 命名 空间 而 引入 的 。 为 
了 更 好 地 理解 这 点 ， 让 我 们 看 一 下 上 述 声明 所 在 的 上 下 文 : 


<schema xmlns="http: //www.w3.org/2001/XMLSchema" 
xmlns:adm="http://xyz.edu/Admin" 
targetNamespace="http: //xyz.edu/Admin"> 


<element name="CrsName" type="string"/> 
<!-- reference to StudentStatus --> 
<element name="Status" type="adm:studentStatus"/> 


<!-- definition of StudentStatus --> 
<simpleType name="studentStatus"> 


</simpleType> 


</schena> 

在 模式 文档 中 ， 默 认 的 命名 空间 通常 是 XMLSchema 命 名 空间 。 这 使 得 我 们 频繁 地 使 用 诸 
如 element、simpleType、name 和 type 等 时 ， 可 以 不 加 前 级 。 另 外 ， 模 式 文档 中 定义 了 许多 属 
于 目标 命名 空间 (本 例 中 为 http://xyz.edu/Admin) 的 类 型 (如 studentStatus )、 元 素 (如 Status) 
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和 属性 〈 参 见 后 续 章 节 )。 定 义 新 元 素 或 类 型 的 时 候 ， 并 不 需要 加 上 前 缀 (如 name="Status" 和 
name= "StudentStatus" )， 这 是 因为 这 些 名 字 是 新 定义 的 ， 正 因为 是 新 定义 的 ， 所 以 不 可 能 属于 
默认 命名 空间 。 它 们 被 自动 加 入 到 目标 命名 空间 中 。 然 而 ， 怎 样 才能 引用 该 模式 中 定义 的 名 
称 呢 (比如 说 ， 在 type 属 性 中 引用 studentStatus) ? 如 果 不 使 用 前 级 ，XML 处 理 器 就 会 认为 该 
名 字 属 于 默认 命名 空间 。 这 正 是 处 理 string 类 型 的 CrsName 元 素 的 情况 。 因 为 string 没 有 前 绿 ， 
所 以 它 被 认为 来 自 标准 的 XML Schema 命 名 空间 ， 这 是 正确 的 。 但 是 ， 若 不 加 前 绿地 使 用 
studentStatus ， 那 就 会 导致 处 理 器 认为 studentStatus 也 是 出 自 默 认命 名 空间 ， 这 是 错误 的 ， 因 
为 XML Schema 并 没有 定义 studentStatus。 因 此 我 们 应 该 为 目标 命名 空间 定义 前 级 ， 每 次 引用 
到 其 中 的 标记 时 都 要 加 上 该 前 级 。 上 例 中 第 二 个 xmlns 属 性 . ( schema 元素 中 ) 的 定义 就 是 为 了 
将 adm 和 目标 命名 空间 联系 起 来 。 从 现在 起 ， 我 们 就 假设 目标 命名 空间 对 应 的 前 缀 是 adm， 以 
后 在 已 定义 的 类 型 中 使 用 它 时 就 不 作 说 明了 。 
接 下 来 ， 让 我 们 看 看 该 如 何 定义 文档 中 的 属性 类 型 : 


<attribute name="Date" type="date"/> 

<attribute name="StudId" type="adm:studentId"/> 
<attribute name="Members" type="adm:studentIds"/> 
<attribute name="CrsCode" type="adm:courseCode"/> 


注意 ， 这 些 定义 并 没有 将 属性 和 元 素 联系 在 一 起 ， 在 这 一 点 上 属性 并 没有 什么 意义 。 这 
里 还 不 能 建立 这 种 联系 ， 因 为 具有 属性 的 元 素 被 认为 是 复杂 类 型 (即使 内 容 为 空 ， 如 
CrsTaken ) ， 所 以 我 们 需要 先 熟 悉 这 些 复杂 类 型 。 


17.3.3 复杂 类 型 


1. 基本 的 例子 
到 目前 为 止 ， 我 们 已 经 知道 如 何 定义 简单 类 型 ， 即 不 包含 属性 或 子 元 素 的 元 素 类 型 。 图 
17-7 的 模式 片段 定义 了 一 个 复杂 数据 类 型 ， 该 类 型 能 表示 报告 文档 中 的 Student 元 素 。 


<complexType name="studentType"> 

<sequence> 
<element name="Name" type="adm:personNameType"/> 
<element name="Status" type="adm:studentStatus"/> 
<element name="CrsTaken" type="adm:courseTakenType" 

minOccurs="0" maxOccurs="unbounded"/> 
</sequence> 
<attribute name="StudId" type="adm:studentId"/> 


</complexType> 
<complexType name="personNameType"> 
<sequence> 
<element name="First" type="string"/> 
<element name="Last" type="string"/> 
</sequence> 
</complexType> 





图 17-7 复杂 类 型 studentType 的 定义 


这 个 简单 的 例子 包含 两 个 类 型 声明 ， 并 具备 多 个 新 的 特征 。 第 一 ， 使 用 了 标记 
ComplexType 而 不 是 SimpleType， 这 样 XML 处 理 器 就 知道 将 处 理 的 是 复杂 类 型 。 第 二 ， 标 记 
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Sequence 用 于 指定 元 素 name、Status 和 CrsTaken 必 须 以 给 定 的 顺序 出 现 。 第 三 ， 元 素 CrsTaken 
( 稍 后 给 出 它 的 类 型 定义 ) 出 现 的 次 数 可 能 是 0 次 、1 次 或 多 次 。 一 般 来 说 ，minOccurs 和 
maxOccurs 的 值 可 以 是 任何 数字 。 而 DTD 中 作 这 样 的 说 明 虽 然 可 行 ， 但 是 很 不 方便 ， 因 为 
DTD 必 须 使 用 选择 方案 (规定 使 用 的 是 “| ”符号 ) 罗列 出 所 有 的 可 能 ， 这 样 会 导致 模式 元 长 。 
对 于 其 他 元 素 ， 我 们 没有 定义 minOccurs 和 maxOccurs， 因 为 它们 的 默认 值 都 为 1 (总 之 是 我 们 
想 要 的 结果 )。 最 后 ， 该 复杂 类 型 定义 结尾 的 属性 声明 将 StudId 和 studentId 类 型 关联 在 一 起 
(参见 图 17-8) ， 而 且 因为 它 出 现在 studentType 的 定义 中 ， 所 以 意味 着 每 一 个 studentType 类 型 
的 元 素 都 必须 包含 这 个 属性 ( 除 此 之 外 没有 其 他 属性 )。 

图 17-7 中 的 第 二 个 类 型 声明 给 出 了 Name 元 素 的 类 型 ，Name 元 素 在 studentType 类 型 的 定义 
中 需要 用 到 ， 这 个 声明 中 没有 涉及 schema 语 言 的 新 特性 。 | 

定义 一 个 元 素 为 复杂 类 型 与 定义 一 个 元 素 为 简单 类 型 没什么 区 别 。 下 面 的 声明 将 Student 
元 素 定 义 为 复杂 类 型 studentType: 


<element name="Student" type="adm:studentType"/> 


2. 特殊 情况 
如 果 考 虑 下 面 的 两 种 特殊 情况 ， 刚 才 介 绍 的 简单 情况 就 变 得 复杂 了 : 怎样 才能 定义 一 个 
具有 简单 内 容 (如 没有 子 元 素 的 文本 类 型 ) 和 属性 的 元 素 类 型 ， 以 及 怎样 才能 定义 只 有 属性 
而 没有 内 容 的 元 素 (在 DTD 中 定义 为 EMPTY ) ? 我 们 已 经 在 Romeo 和 Apothecary 的 对 话 文档 
中 接触 过 第 一 种 情况 ， 图 17-6 中 的 CrsTaken 元 素 表 示 出 第 二 种 情况 。 
第 一 种 元 素 定义 起 来 不 太 方 便 ， 因 为 这 种 情况 在 使 用 XML 的 数据 表示 中 很 少 出 现 ， 所 以 
这 里 我 们 就 不 予 介绍 。 而 诸如 CrsTaken 的 第 二 种 元 素 的 类 型 定义 就 很 简单 了 ， 如 下 所 示 : 
<complexType name="courseTakenType"> 
<attribute name="CrsCode" type="adm: courseRef"/> 
<attribute name="Semester" type="string"/> 
</complexType> 
3. 构造 元 素 组 
从 图 17-7 中 的 studentType 的 定义 中 ， 我 们 知道 怎样 使 用 sequence 将 多 个 元 素 组 合成 一 个 有 
序 元素 组 。 像 sequence 这 样 能 够 将 多 个 元 素 合成 组 的 标记 叫做 合成 器 (compositor). “rie 
具有 复杂 的 内 容 ， 即 它 至 少 有 一 个 子 元 素 ， 这 时 我 们 必须 使 用 合成 器 来 完成 元 素 的 定义 。 
XML Schema 提供 了 几 种 合成 器 ， 其 中 一 种 允许 将 元 素 组 成 一 个 无 序 元 素 组 。 注 意 ， 在 17.2.5 
节 中 ， 缺 少 一 种 实用 的 方法 来 定义 无 序 元 素 集 是 DTD 的 一 个 重要 的 缺陷 。 
假设 我 们 希望 街道 、 门 牌号 码 和 城市 可 以 以 任意 的 顺序 出 现在 地 址 中 ， 那 么 我 们 可 以 使 
用 合成 器 all: 


<complexType name="addressType"> 
<all> 
<element name="StreetName" type="string"/> 
<element name="StreetNumber" type="string"/> 
<element name="City" type="string"/> 
</all> 
</complexType> 
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但 是 ， 使 用 al 必须 满足 许多 限制 条 件 ， 这 就 使 得 它 不 能 广泛 地 使 用 。 这 些 限制 条 件 包 括 : 第 
一 ，all 必 须 直接 出 现在 complexType 的 下 方 ， 所 以 下 面 的 定义 是 不 正确 的 : 


<complexType name="studentType2"> 
<sequence> 
<all> 
<element name="Name" type="adm:personNameType" /> 
<element name="Status" type="adm:studentStatus"/> 
</all> 
<element name="CrsTaken" type="adm: courseTakenType" 
minOccurs="0" maxOccurs="unbounded"/> 
</sequence> 
<attribute name="StudId" type="adm: studentId"/> 
</complexType> 


第 二 ，all 包 含 的 所 有 元 素 都 不 能 重复 。 换 句 话说 ，all 的 所 有 子 元 素 的 maxOccurs 值 必须 为 1， 
所 以 下 面 的 定义 是 不 允许 的 : 


<complexType name="studentType3"> < 
<all> 
<element name="Name" type="adm:personNameType"/> 
<element name="Status" type="adm:studentStatus"/> 
<element name="CrsTaken" type="adm:courseTakenType" 
minOccurs="0" maxOccurs="unbounded" /> 
</all> 
<attribute name="StudId" type="adm: studentId"/> 
</complexType> 


XML Schema 中 的 第 三 种 合成 器 是 choice 合 成 器 ， 在 复杂 类 型 中 使 用 choice 的 作用 和 在 简 
单 类 型 中 使 用 union 的 作用 是 一 样 的 。 下 面 就 是 说 明 其 用 法 的 一 个 例子 : 


<complexType name="addressType"> 
<sequence> 
<choice> 
<element name="POBox" type="string"/> 
<sequence> 
<element name="Name" type="string"/> 
<element name="Number" type="string"/> 
</sequence> 
</choice> 
<element name="City" type="string"/> 
</sequence> ë 
</complexType> 


Choice 人 允许 我 们 使 用 邮箱 来 代替 街道 地 址 。 也 就 是 说 ， 一 个 合法 的 地 址 或 者 是 一 个 邮箱 ， 或 
者 是 一 个 街道 地 址 。 
注意 ， 即 使 类 型 只 有 一 个 子 元 素 ， 也 需要 使 用 合成 器 之 类 的 内 容 描述 器 ， 例 如 : 


<complexType name="foo"> 
<element name="bar" type="integer"/> 
</complexType> 


是 错误 的 ， 而 
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<complexType name="foo"> 
<sequence> 
<element name="bar" type="integer"/> 
</sequence> 
</complexType> 


才 是 正确 的 。 
4. 局 部 元 素 名 字 
在 DTD 中 ， 所 有 的 元 素 声明 都 是 全 局 的 ， 因 为 它 只 允许 一 个 元 素 名 对 应 一 个 ELEMENT 语 
句 。 因 此 ，( 对 任何 一 个 DTD 而 言 ) 无 法 定义 出 一 个 有 效 的 报告 文档 ， 其 中 元 素 Student 和 
Course 都 有 一 个 名 为 Name 的 子 元 素 。 事 实 上 ， 图 17-4 中 课程 名 是 一 个 字符 串 ， 而 学 生 名 却 是 
一 个 复杂 类 型 personNameType。 这 就 是 在 报告 文档 中 使 用 CrsName 而 不 使 用 Name 的 最 根本 的 
原因 。 因 为 同样 的 原因 ， 在 DTD 中 不 允许 使 用 元 素 名 Course 替 代 CrsCode 作 为 Class 元 素 的 子 
元 素 名 ， 因 为 Courses 中 已 经 定义 了 一 个 子 元 素 Course ,而 且 它 的 结构 和 Class 的 子 元 素 
CrsCode 并 不 一 样 。 所 以 ， 如 果 我 们 用 Course 替 换 CrsCode ， 那 么 在 DTD 中 Course 必 须 对 应 两 
个 不 同 的 ELEMENT 语 名 ， 这 是 不 可 能 的 。 . 
XML Schema 规范 通过 提供 局 部 范围 的 元 素 声 明 来 解决 这 个 问题 。 这 种 做 法 和 许多 编程 语 
言 一 样 。 元素 类 型 的 作用 域 是 距离 最 近 的 包含 < 复杂 类 型 …>…</ 复 杂 类 型 > 块 , 在 报告 文档 中 ，. 
局 部 范围 机 制 使 得 我 们 可 以 将 标记 CrsName 改 名 为 Name 并 定义 下 面 的 模式 : 
<complexType name="studentType"> 
<sequence> 
<element name="Name" type="adm:personNameType"/> 
<element name="Status" type="adm:studentStatus"/> 
<element name="CrsTaken" type="adm: courseTakenType" 
minOccurs="0" maxOccurs="unbounded"/> 
</sequence> 
<attribute name="StudId" type="adm:studentId"/> 
</complexType> 
<complexType name="courseType"> 
<sequence> 
<element name="Name" type="string"/> 
</sequence> 
<attribute name="CrsCode" type="adm: courseCode"/> 
</complexType> 
这 里 studentType 和 courseType 都 包含 子 元 素 Name。 前 一 个 Name 子 元 素 是 一 个 复杂 类 型 
personNameType， 包 含 First 和 Last 两 个 元 素 。 后 一 个 Name 子 元 素 是 简单 类 型 String。 然 而 ， 
和 DTD 不 一 样 的 是 ， 因 为 这 两 个 声明 的 作用 域 不 一 样 ， 所 以 它们 不 会 冲突 。 
5. 导入 模式 
在 17.3.1 节 中 , 我 们 介绍 了 怎样 使 用 include 将 分 散在 不 同文 件 中 的 模式 导 人 构成 一 个 模式 。 
这 一 语句 使 得 合作 开发 小 组 可 以 模块 化 地 构造 复杂 的 模式 。 正 因为 这 种 使 用 方法 ， 被 包含 的 
模式 文档 和 包含 它 的 模式 文档 必须 属于 同一 个 命名 空间 。 
同时 ，XML Schema 规范 的 设计 者 也 意识 到 ， 只 有 将 不 同 的 组 或 组 织 构造 的 模式 文档 合并 
起 来 ，Web 的 潜在 性 能 才能 得 以 实现 。 这 就 是 import 语 名 的 目标 。 和 include 语 名 一 样 ， import 
也 提供 了 schemaLocation 属 性 ， 只 不 过 该 属性 对 于 import 是 可 选 的 。import 语 句 中 唯一 必须 的 
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属性 是 namespace ， 因 为 导入 具有 不 同 命名 空间 的 模式 文档 是 可 能 的 。 假 如 import 语 句 中 没有 
指定 schemaLocation 的 值 ， 那 么 XML 处 理 器 就 会 自己 寻找 该 模式 文档 ， 处 理 器 可 能 会 根据 一 
些 约定 从 命名 空间 中 得 到 模式 文档 。 即 使 指定 了 schemaLocation 的 值 ，XML 处 理 器 也 可 以 忽 
略 它 或 者 使 用 另 一 个 模式 ，XML 处 理 器 唯一 不 能 忽略 的 就 是 命名 空间 。 
在 下 例 中 ， 我 们 用 import 语 名 替代 include 语 句 : 
<schema xmlns="http://www.w3.org/2001/XMLSchema" 
targetNamespace="http://xyz.edu/Admin"> 
xmlns:reg = "http://xyz.edu/Registrar" 
xmmlns:crs = "http://xyz.edu/Courses"> 
<import namespace="http://xyz.edu/Registrar" 
schemaLocation="http://xyz.edu/Registrar/StudentTypes .xsd"/> 
<import namespace="http://xyz.edu/Courses"/> 


</schema> 
这 里 ， 我 们 假设 上 述 模式 文档 的 实例 文档 包含 学 生 记 录 和 课程 ， 它 们 属于 不 同 的 命名 空间 ， 
而 且 报告 文档 的 处 理 软件 能 找到 描述 课程 的 模式 。 因 此 ， 在 第 二 个 import 语 名 中 并 没有 提供 
schemaLocation 属 性 (但 第 一 个 语句 中 提供 了 该 属性 )。 第 一 个 import 语 句 将 目标 命名 空间 为 
http://xyz.edu/Registrar 的 schema 文 档 Sch 导 入 。 而 上 面 的 模式 声明 该 目标 命名 空间 对 应 的 前 组 
是 reg， 这 样 我 们 就 可 以 用 reg:x 作 为 对 Sch 中 的 元 素 x 的 引用 。 

6. 通过 extension 和 restriction 构 造 新 的 复杂 类 型 * 

某 些 情况 下 ， 用 户 可 能 需要 对 用 include 或 import 包 含 进来 的 模式 文档 作 某 些 修 改 。 这 在 
include 中 是 很 容易 做 到 的 ， 因 为 文档 作者 可 以 控制 所 有 的 文档 。 然 而 ， 在 import 中 ， 包 含 进 
来 的 外 部 文档 的 控制 权 通 常 是 属于 某 个 外 部 机 构 的 ， 导 入 它们 的 模式 文档 可 能 无 权 复制 它们 ， 
或 者 也 不 想 这 样 做 。 例 如 ， 在 许多 情况 下 ， 导 入 者 只 想得到 原 模式 的 一 个 视图 ， 这 样 导入 者 
的 模式 可 以 和 原 模 式 同步 变化 。 

XML Schema 规范 提供 两 种 机 人 制 来 修改 导入 的 模式 : extension 和 restriction。 它 们 都 是 第 
16 章 介绍 的 subtype 概 念 的 特例 。 扩 展 模 式 意味 着 向 文档 中 增加 新 的 元 素 或 属性 。 限 制 模式 文 
档 意 味 着 进一步 限定 其 定义 ， 以 便 过 滤 掉 一 些 不 符合 条 件 的 实例 文档 。 

假设 foo.edu 打 算 以 xyz.edu 为 例 ， 以 XML 语 言 构建 他 们 的 注册 系统 。 他 们 的 模式 总 的 来 说 
和 xyz.edu 的 相同 ， 但 希望 为 每 个 课程 记录 添加 一 个 简短 的 课程 提纲 。 因 为 xyz.edu 会 经 常 改进 
它 的 学 生 福 册 工具 ， 所 以 foo.edu 希 望 导入 该 模式 并 使 用 扩展 机 制 ， 而 不 是 将 它 直接 拷贝 过 来 ， 
这 样 就 可 以 利用 到 原 模式 的 改进 。 特 别 地 ，foo.edu 想 要 扩展 类 型 courseType (参见 图 17-9)， 
在 该 类 型 中 增加 一 个 新 的 元 素 syllabus (课程 大 纲 )。 最 后 ， 他 们 建立 了 如 下 的 模式 文档 : 

<schema xmlns="http: //www.w3.org/2001/XMLSchema" 

xmlns:xyzCrs="http://xyz.edu/Courses" 
xmlns:fooAdm="http: //foo.edu/Admin"> 
targetNamespace="http://foo.edu/Admin"> 


<!-- fooAdm is the prefix to be used with the target namespace --> 
<import namespace="http://xyz.edu/Courses"/>°  ' 


<complexType name="courseType"> 
<complexContent> 
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<extension base="xyzCrs:courseType"> 
<element name="syllabus" type="string"/> 
</extension> 
</complexContent> 
</complexType> 
<!-- Now define a Course element for the target namespace 
and associate it with the derived type --> 
<element name="Course" type="fooAdm: courseType"/> 


</schema> 
注意 ,现在 的 目标 命名 空间 是 http://foo.edu/Admin， 这 是 大 学 客户 的 命名 空间 ， 对 应 的 前 组 是 
fooAdm。 文 档 使 用 import 语 句 将 xyz.edu 包 含 进来 作为 构造 新 的 模式 的 基础 。 因 为 新 的 模式 引 
用 了 xyz.edu 的 命名 空间 中 的 名 字 ( 如 courseType )， 所 以 我 们 需要 为 导入 的 命名 空间 xyz.edu 定 
义 一 个 前 级 ， 这 里 使 用 的 是 xyzCrs。 

定义 好 命名 空间 之 后 , 我 们 需要 使 用 导入 的 模式 中 的 对 应 类 型 , 定义 新 的 类 型 courseType。 
新 定义 的 类 型 没有 前 缀 ， 因 为 我 们 希望 它 属于 目标 命名 空间 。 然 而 ， 从 xyz.edu 中 导入 的 基 类 
型 需要 加 前 缀 ， 以 xyzCrs: courseType 作 为 对 它 的 引用 。 为 了 告诉 XML 处 理 器 将 要 处 理 的 是 
一 个 由 另 一 个 类 型 修改 得 到 的 复杂 类 型 ，XML Schema 规范 要 求 必 须 给 出 <complexContent>… 
</complexContent> 标 记 对 。 在 这 个 标记 对 中 ， 需 要 指定 extension 或 restriction 中 的 一 种 。 上 例 
中 使 用 的 是 extension ， 它 表示 指定 元 素 syllabus 将 被 加 入 到 类 型 xyzCrs:courseType 中 以 构成 新 
类 型 courseType (新 类 型 属于 目标 命名 空间 http://foo.edu/Admin ) 。 

foo.edu 可 能 会 对 原 模式 文档 做 其 他 的 修改 。 例 如 ， 它 们 可 能 需要 定义 一 个 像 命名 空间 
http://xyz.edu/Admin ( 见 图 17-8) 中 定义 的 studentType 一 样 的 元 素 ， 有 一 点 不 同 的 是 ， 不 允 
许 学 生 选 修 任意 数量 的 课程 ( 原 模式 中 maxOccurs="unbounded")。 因 此 ，foo.edu 会 将 原 模式 
的 选修 课程 数目 限制 为 63， 如 下 所 示 : 

<schema xmlns="http://www.w3.org/2001/XMLSchema" 

xmlns:xyzCrs="http://xyz.edu/Courses" 


xmlns:fooAdm="http://foo.edu/Admin"> 
targetNamespace="http://foo.edu/Admin"> 


<import namespace="http://xyz.edu/Courses"/> 


<complexType name="studentType"> 
<complexContent> 
<restriction base="xyzCrs:studentType"> 
<sequence> 
<element name="Name" type="xyzCrs : personNameType" /> 
<element name="Status" type="xyzCrs:studentStatus"/> 
<element name="CrsTaken" type="xyzCrs: courseTakenType" 
minOccurs="0" maxOccurs="63"/> 
</sequence> 
<attribute name="StudId" type="xyzCrs:studentId"/> 
</restriction> 
</complexContent> 
</complexType> 
<!-- Now define a Student element for the target namespace 
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and associate it with the derived type --> 
<element name="Student" type="fooAdm: studentType"/> 


</schema> 


和 类 型 扩展 机 制 类 似 ， 我 们 在 complexContent 块 中 使 用 了 restriction 标 记 。 然 而 ， 它 们 的 
主要 区 别 在 于 ， 在 限制 复杂 类 型 时 ， 我 们 必须 重复 基 类 型 中 所 有 元 素 和 属性 的 声明 。 同 时 ， 
我 们 可 以 在 基 类 型 的 各 部 分 上 加 限制 ， 例 如 ， 将 maxOccurs="unbounded" 作 更 严格 的 限制 ， 改 


为 maxOccurs="63"。 


17.3.4 一 个 完整 的 Schema 文档 


在 前 面 的 例子 中 ， 我 们 已 经 接触 了 很 多 定义 模式 的 技巧 ， 现 在 让 我 们 将 这 些 部 分 合并 起 
来 组 成 一 个 完整 的 模式 ， 该 模式 包含 许多 类 型 定义 并 至 少 有 一 个 全 局 元 素 〈 即 文档 的 根 元 素 ) 
的 定义 ， 该 定义 将 根 元 素 名 和 一 个 复杂 类 型 联系 起 来 。 这 个 复杂 类 型 可 能 还 包含 其 他 元 素 和 
属性 的 声明 ， 而 这 些 子 元 素 和 属性 的 定义 同样 又 和 它们 的 类 型 联系 起 来 。 从 根 元 素 开始 ， 我 
们 可 以 在 它 的 下 一 层 找 到 它 所 有 的 属性 和 子 元 素 。 这 样 重复 下 去 ， 我 们 可 以 找到 处 于 文档 结 
构 任意 层次 的 元 素 和 属性 。 


<schema xmlns="http://www.w3.org/2001/XMLSchema" 
xmlns:adm="http://xyz.edu/Admin" 
targetNamespace="http://xyz.edu/Admin"> 


<include schemaLocation="http: //xyz.edu/StudentTypes.xsd"/> 
<include schemaLocation="http://xyz.edu/CourseTypes.xsd"/> 


<element name="Report" type="adm:reportType"/> 


<complexType name="reportType"> 
<sequence> 
<element name="Students" type="adm:studentList"/> 
<element name="Classes" type="adm:classOfferings"/> 
<element name="Courses" type="adm: courseCatalog"/> 
</sequence> 
</complexType> 
<complexType name="studentList"> 
<sequence> 
<element name="Student" type="adm:studentType" 
minOccurs="0" maxOccurs="unbounded" /> 
</sequence> 
</complexType> 


<!-— Plus the definition of classOfferings, courseCatalog --> 
<!-- the definition of studentType is in the included schema 
http://xyz.edu/studentTypes.xsd --> i 
</schema> 


我 们 略 去 了 较 低 层 的 classOfferings 类 型 和 courseCatalog 类 型 的 定义 ， 它 们 的 定义 和 
studentList 的 定义 类 似 。 和 studentList 一 样 ， 这 些 类 型 也 是 根据 图 17-8 和 图 17-9 中 所 示 类 型 的 
形式 来 定义 的 。 
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<schema xmlns="http: //www.w3.org/2001/XMLSchema" 
xmlns:adm="http: //xyz.edu/Admin" 
targetNamespace="http: //xyz.edu/Admin"> 


<complexType name="studentType"> 
<sequence> 
<element name="Name" type="adm: personNameType"/> 
<element name="Status" type="adm:studentStatus"/> 
<element name="CrsTaken" type="adm:courseTakenType”" 
minOccurs="0" maxOccurs="unbounded"/> 
</sequence> 
<attribute name="StudId" type="rpt:studentId"/> 
</complexType> 
<complexType name="personNameType"> 
<sequence> 
<element name="First" type="string"/> 
<element name="Last" type="string"/> 
</sequence> 
</complexType> 
<simpleType name="studentStatus"> 
<restriction base="string"> 
<enumeration value="U1"/> 
<enumeration value="U2"/> 


<enumeration value="G5"/> 
</restriction> 
</simpleType> 


<simpleType name="studentId"> 
<restriction base="ID"> 
<pattern value=" [0-9] {9}"/> 
</restriction> 
</simpleType> 
<simpleType name="studentIds"> 
<list itemType="studentRef"/> 
</simpleType> 
<simpleType name="studentRef"> 
<restriction base="IDREF"> 
<pattern value=" [0-9] {9}"/> 
</restriction> 
</simpleType> 
</schema> 





图 17-8 http://xyz.edu/StudentTypes xsdkbfyStudent3s 74 


和 以 前 一 样 ， 我 们 必须 小 心 处 理 命名 空间 ， 所 以 这 里 将 目标 命名 空间 的 前 缀 定义 为 adm， 
引用 该 模式 文档 中 的 任何 名 字 都 需要 加 上 这 个 前 缀 (除了 使 用 属性 name 定 义 这 些 名 字 的 声明 
语句 )。 前 面 提 过 ， 包 含 的 模式 和 被 包含 的 模式 应 该 属于 同一 个 命名 空间 ， 所 以 前 缀 adm 既 是 
包含 模式 (如 adm:courseCatalog ) 中 名 字 的 前 缀 又 是 被 包含 的 模式 (如 adm:studentType) 中 
名 字 的 前 缀 。 
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<schema xmlns="http://www.w3.org/2001/XMLSchema" 
. xmlns:adm="http://xyz.edu/Admin" 
targetNamespace="http://xyz.edu/Admin"> 


<complexType name="courseTakenType"> 
<attribute name="CrsCode" type="adm: courseRef"/> 
<attribute name="Semester" type="string"/> 
</complexType> 
<complexType name="courseType"> 
<sequence> 
<element name="Name" type="string"/> 
</sequence> 
<attribute name="CrsCode" type="adm:courseCode"/> 
</complexType> 


<simpleType name="courseCode"> 
<restriction base="ID"> 
<pattern value=" [A-Z] {3} [0-9] {3}"/> 
</restriction> 
</simpleType> 
<simpleType name="courseRef"> 
<restriction base="IDREF"> 
<pattern value=" [A-Z] {3} [0-9] {3}"/> 
</restriction> 
</simpleType> 
</schema> 





图 17-9 http://xyz.edu/CourseTypes.xsd 处 的 Course 类 型 


匿名 类 型 
到 目前 为 止 ， 我们 定义 的 所 有 类 型 都 是 有 名 字 的 类 型 (named type )， 因 为 每 个 类 型 定义 
都 有 一 个 相关 的 名 字 ， 而 每 一 个 新 元 素 都 有 一 个 有 名 字 的 类 型 与 之 匹配 。 当 我 们 需要 在 几 个 
元 素 或 属性 的 定义 间 共 享 同一 个 类 型 时 ， 对 类 型 进行 命名 就 很 有 有 用。 然而， 在 很 多 情况 下 ， 
某 个 类 型 可 能 只 有 一 个 ， 不 会 被 再 次 用 到 。 例 如 ， 在 上 述 报告 文档 的 完整 的 模式 中 ， 
reportType 类 型 (以 及 几 个 其 他 的 类 型 ， 如 studentList 和 classOfferings ) 就 不 需要 被 共享 ， 在 
这 种 情况 下 ， 使 用 匿名 类 型 (anonymous type) 更 方便 。 
匿名 类 型 和 有 名 字 的 类 型 的 定义 很 相似 ， 只 是 匿名 类 型 的 定义 中 没有 name 属 性 ， 而 且 匿 
名 类 型 的 定义 必须 和 使 用 它 的 element 或 attribute 的 定义 写 在 一 起 。 这 些 附 上 匿名 类 型 的 定义 和 
原来 的 定义 有 些 不 同 。 首 先 ， 定 义 时 不 使 用 type 属 性 引入 匿名 类 型 。 其 次 ， 定 义 时 使 用 标记 
对 而 不 是 使 用 空 标 记 <eiement…/> 和 <attribute…/>>， 匿 名 类 型 的 定义 被 包含 在 开始 和 结束 标记 
对 中 ， 这 样 我 们 就 可 以 使 用 匿名 类 型 将 上 面 的 Report 元 素 的 定义 修改 为 : 
<element name="Report"> 
<complexType> 
<sequence> 
<element name="Students" type="adm:studentList"/> 
<element name="Classes" type="adm: classOfferings"/> 
<element name="Courses" type="adm: courseCatalog"/> 
</sequence> l 


</complexType> 
</element> 
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类 似 地 ， 我 们 可 以 匿名 类 型 来 修改 元 素 Students、Classes 和 Courses 的 定义 。 在 这 种 情况 
下 ， 相 应 类 型 定义 的 内 容 必须 直接 包含 在 上 述 模式 中 。 


17.3.5 完整 性 约束 


前 面 我 们 谈 到 了 XML 文档 中 的 参照 完整 性 的 问题 ， 并 介绍 了 XML Schema 规范 是 怎样 克 
服 DTD 在 这 方面 的 缺陷 的 。 然 而 ， 即 使 在 XML Schema 规范 中 ， 我 们 仍然 使 用 从 DTD 继 承 的 
特殊 类 型 ID、IDREF 和 IDREFS。 为 了 说 明 这 种 机 制 的 局 限 性 ， 我 们 定义 图 17-4 中 的 Class 元 素 
的 类 型 。 

<element name="Class" type="adm:classType"/> 

<complexType name="classType"> 

<sequence> 
<element name="CrsCode" type="adm: courseCode"/> 
<element name="Semester" type="string"/> 
<element name="ClassRoster" type="adm:classListType"/> 
</sequence> 
</complexType> 
<complexType name="classListType"> 
<attribute name="Members" type="adm: studentIds"/> 
</complexType> 


显然 ， 如 果 某 个 学 生 通 过 Student 的 子 元 素 CrsTaken 宣 称 他 选 了 某 门 课 程 ， 相 应 的 课程 必定 
在 特定 的 学 期 中 开设 。 课 程 给 出 的 方式 在 我 们 文档 中 通过 Class 元 素描 述 。 假 定 有 下 面 的 元 素 : 


<CrsTaken CrsCode="CS308" Semester="F1997"/> 


那么 就 一 定 存 在 下 列 形式 的 元 素 


<Class> 
<CrsCode>CS308</CrsCode><Semester>F1997</Semester> 


</Class> 


问题 是 ，CrsCode 和 Semester 都 不 能 唯一 地 决定 一 个 Class 元 素 ， 因 此 这 时 ID/IDREF 机 制 就 不 
能 发 挥 作用 8。 而且， 使 用 ID/IDREF 机 制 ， 我 们 不 能 将 文档 某 部 分 的 一 组 值 (如 CrsTaken 标 
记 的 CrsCode 和 Semester 属 性 ) 关联 到 文档 另 一 部 分 的 一 组 值 (Class 的 子 元 素 CrsCode 和 
Semester) 之 上 。 这 是 经 常会 磁 到 的 问题 ， 在 传统 数据 库 中 ， 我 们 使 用 多 属性 键 〈 键 由 多 个 
属性 组 成 ) 来 解决 这 个 问题 。 

1.XML 的 键 

为 了 解决 上 述 问 题 ，XML Schema 规范 允许 使 用 多 属性 键 和 外 键 约 束 ， 使 用 方法 和 SQL 中 
的 方法 相似 。 但 稍微 复杂 一 些 ，SQL 处 理 的 是 平面 的 关系 ， 所 以 指定 多 属性 键 时 ， 只 要 将 属 
于 该 键 的 属性 列 出 即 可 。 同 样 地 ， 在 SQL 中 定义 外 键 约 束 时 ， 只 要 列 出 引用 和 被 引用 的 关系 
中 的 相关 属性 就 可 以 了 。 但 是 ， 在 XML 中 处 理 的 却 是 复杂 结构 的 数据 ， 键 的 概念 就 更 加 复杂 。 
事实 上 ， 键 可 能 是 由 位 于 元 素 内 部 不 同 层次 的 值 的 序列 组 成 的 。 

假设 引用 的 上 下 文 环境 是 Class 元 素 的 父 元 素 ， 那 么 我 们 可 以 认为 Class 元 素 集合 的 键 是 由 


全 ”在 XML Schema 中 ， 类 型 ID 和 IDREF 不 仅 限 于 属性 。 
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路 径 表 达 式 对 Class/CrsCode 和 Class/Semester 能 访问 到 的 值 所 组 成 的 。 从 第 16 章 的 介绍 可 知 ， 
我 们 已 经 熟悉 了 路 径 表 达 式 的 概念 ， 但 在 XML 中 ， 路 径 表 达 式 更 加 细致 。 事 实 上 ，XML 路 径 
表达 式 是 另 一 种 规范 一 一 XPath 一 一 的 一 部 分 ， 我 们 将 在 17.4.1 节 中 学 习 XPath 的 相关 内 容 。 

为 了 说 明 XML 中 键 规范 的 复杂 性 ， 我 们 扩展 Class 元 素 的 定义 ， 在 其 中 增加 班级 ， 并 从 学 
期 的 年 份 中 分 解 出 季节 。 


<Class> 
<CrsCode Section="2">CS308</CrsCode> 
<Semester><Season>Fall</Season><Year>1997</Year></Semester> 





</Class> 
这 里 ， 能 唯一 决定 class 的 一 系列 值 分 散在 不 同 地 方 ( 属 性 、 元 素 内 容 ) 和 不 同 层次 (在 
CrsCode 标 记 的 Section 属 性 ，CrsCode 标 记 的 内 容 ，Semester 元 素 的 子 元 素 Season 以 及 Semester 
的 子 元 素 Year 中 都 有 )。 下 面 就 是 用 Xpath 描 述 的 访问 它们 的 路 径 表 达 式 : 

CrsCode/@Section 

CrsCode 


Semester/Season 
Semester/Year 


所 有 这 些 路 径 表 达 式 都 和 报告 文档 中 的 Class 元 素 有 关 。 第 一 个 路 径 选 出 标记 CrsCode 的 属性 
Section 的 值 ， 这 里 CrsCode 必 须 是 当前 元 素 ( 设 为 Class 元 素 ) 的 子 元 素 。 第 二 条 路 径 选 出 
CrsCode 元 素 的 内 容 〈 即 CrsCode 节 点 的 开始 标记 和 结束 标记 之 间 的 文本 )。 第 三 条 路 径 得 到 的 
是 元 素 Season 的 内 容 ， 这 里 Season 必 须 是 元 素 Semester 的 子 元 素 ， 而 元 素 Semester 又 必须 是 当 
前 元 素 的 子 元 素 。 第 四 条 路 径 也 是 类 似 的 情况 。 

XML Schema 提供 了 两 种 定义 键 的 方法 。 一 种 是 使 用 标记 unique ， 和 SQL 中 的 限定 词 
UNIQUE 类 似 。 标 记 unique 指 定 了 候选 键 (第 4 章 中 的 术语 )。 另 一 种 是 使 用 标记 key， 对 应 
SQL 中 的 PRIMARY KEY 约 束 。 在 XML 中 ，unique 和 key 之 间 的 唯一 区 别 就 在 于 key 不 能 有 空 
ti (在 XML 中 ， 形 如 <footag></footag> 的 元 素 的 值 是 空 字符 串 但 不 是 空 值 ) 。 若 要 指定 footag 
的 值 为 空 值 《在 XML Schema 中 称 为 nil) ， 那 么 需要 下 面 的 定义 : 


<footage xsi:nil="true"></footag> 
这 里 的 nil 是 在 以 下 命名 空间 中 定义 的 : 

http://www.w3.org/2001/XMLSchema-instance 
(这 里 我 们 设 xsi 是 这 个 命名 空间 对 应 的 前 缀 )。 

下 面 是 报告 文档 的 主 多 声明 的 例子 。 除 了 用 unique 标 记 代 替 key 标 记 外 ， 候 选 键 的 定义 是 
相似 的 。 引 用 本 节 之 前 定义 的 classType 类 型 ,我们 想 指定 CrsCode 和 Semester 的 一 对 值 用 于 在 
该 文档 中 唯一 确定 Class 元 素 。 这 可 以 通过 以 下 方法 做 到 : 


<schema xmlns="http://www.w3.org/2001/XMLSchema" 
xmlns:adm="http://xyz.edu/Admin"> 
targetNamespace="http://xyz.edu/Admin"> 


<element name="Report" type="adm:reportType"/> 
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<complexType name="reportType"> 
<sequence> 
<element name="Students" type="adm:studentList"/> 
<element name="Classes"> 
<!-- Replacing adm:classOfferings with anonymous type —-> 
<complexType> 
<sequence> 
<element name="Class" type="adm:classType” 
| minOccurs="0" maxOccurs="unbounded"/> 
</sequence> 
</complexType> 
</element> 
<element name="Courses" type="adm:courseCatalog"/> 
</sequence> 


<key name="PrimaryKeyForClass"> 
<selector xpath="Classes/Class"/> 
<field xpath="CrsCode"/> 
<field xpath="Semester"/> 
</key> 
</complexType> 


<complexType name="classType"> 
<sequence> 
<element name="CrsCode" type="adm:courseCode"/> 
<element name="Semester" type="string"/> 
<element name="ClassRoster" type="adm:classListType"/> 
</sequence> 
</complexType> 


</schema> 


上 面 的 模式 给 出 了 报告 文档 的 相关 类 型 定义 。 命 名 空间 声明 和 类 型 classType 在 前 面 已 经 
讨论 过 了 。 类 型 reportType 用 于 定义 报告 文档 的 根 节点 Report。 它 由 三 个 元 素 组 成 : Students、 
Classes 和 Courses 。Students 类 型 在 17.3.4 节 的 开始 已 经 定义 过 了 。 为 方便 引用 ， 我 们 将 元 素 
Classes 的 类 型 扩展 为 匿名 类 型 ， 并 将 类 型 定义 直接 和 元 素 定义 写 在 一 起 。Courses 元 素 的 类 型 
courseCatalog 的 定义 比较 简单 ， 读 者 可 以 作为 练习 。 

这 里 最 有 趣 的 特征 就 是 使 用 key 标 记 来 声明 键 ， 并 通过 其 属性 name 的 值 
PrimaryKeyForClass 来 表明 这 是 一 个 主键 。 请 注意 ， 即 使 键 只 涉及 ClassType 中 的 部 分 ， 键 的 
定义 仍然 出 现 reportType 的 定义 中 而 不 是 出 现在 classType 的 定义 中 。 这 样 写 是 故意 的 ， 目 的 是 
说 明 XML 键 的 定义 是 和 对 象 集 (通常 是 元 素 集 ) 关联 ， 而 不 是 和 类 型 关联 。selector 标 记 的 属 
性 xpath 指 定 了 一 个 路 径 表 达 式 。 该 路 径 表 达 式 确定 了 键 声明 所 应 用 的 对 象 集 。 对 象 集 不 一 定 
对 应 一 个 类 型 。 例 如 ，.XPath 路 径 表 达 式 可 以 返回 两 个 或 者 更 多 种 不 同类 型 的 元 素 集合 (如 
17.4.1 节 中 的 CrsTaken 和 Class 的 并 )。 这样， 在 XML 中 ， 键 不 一 定 要 和 某 个 类 型 相关 联 ， 这 和 
我 们 以 前 所 看 到 的 很 不 一 样 。 在 我 们 的 例子 中 ， 键 对 应 的 路 径 表 达 式 是 Classes/Class， 该 路 


O 同 亿 一 下 ， 在 关系 模型 中 ， 键 是 为 某 个 模式 的 元 组 集合 定义 的 。 在 下 -了 R 模 型 中 ， 键 是 为 某 个 实体 或 联系 而 
定义 的 。 
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径 表 达 式 和 类 型 reportType 相 关 。 选 择 器 确定 的 是 文档 中 所 有 的 Class 元 素 的 集合 (正巧 和 所 有 
classType 类 型 的 所 有 元 素 集合 相 一 致 ) 。 

肯定 了 合适 的 对 象 集合 之 后 ， 接 下 来 我 们 使 用 子 元 素 field 来 描述 键 的 组 成 。 正 如 前 文 解释 
的 那样 ， 这 些 字段 可 以 来 自 一 个 对 象 的 不 同 地 方 ， 也 可 以 具有 复杂 的 嵌 套 层次 。 然 而 ， 本 例 
比较 简单 ， 键 的 第 一 个 字段 是 元 素 Class 的 子 元 素 CrsCode 的 内 容 ， 第 二 个 字段 是 子 元 素 
Semester 的 内 容 〈 在 field 子 句 的 xpath 属 性 中 所 描述 的 路 径 表 达 式 和 选择 器 确定 的 对 象 集合 是 相 
关 的 。 这 就 是 为 什么 第 一 个 路 径 表 达 式 简单 的 表述 为 CrsCode， 而 不 是 Classes/Class/CrsCode ) 。 
注意 ， 作 为 对 键 的 某 个 字段 的 具体 描述 ， 路 径 表达 式 如 果 要 有 意义 ， 那 么 它 必 须 为 每 个 它 应 
用 的 对 象 只 返回 一 个 值 。 举 例 来 说 ， 对 于 任意 给 定 的 Class 元 素 ， 路 径 表 达 式 CrsCode 只 返回 一 
个 值 ， 因 此 字段 描述 


<selector xpath="Classes/Class"/> 
<field xpath="CrsCode"/> 


是 允许 的 。 相 反 ， 元 素 Student 的 范围 内 的 路 径 表 达 式 CrsTaken/@CrsCode 会 返回 一 组 学 生 选 
修 的 课程 (请 参见 图 17-8 中 studentType 的 定义 )， 因 此 字段 描述 


<selector xpath="Students/Student"/> 
<field xpath="CrsTaken/@CrsCode"/> 


是 不 允许 的 。 

2. XML 中 的 外 键 约束 

接 下 来 ,我 们 希望 学 生 记 录 中 的 每 个 CrsTaken 元 素 能 引用 同一 个 报告 文档 中 确实 存在 的 
课程 元 素 。 这 就 类 似 于 外 键 约束 ， 如 图 17-10 所 示 ， 这 里 使 用 keyref 元 素 定 义 这 种 关系 。 

外 键 约束 由 约束 名 、 引 用 标识 符 、 选 择 器 以 及 一 系列 的 字段 组 成 。 约 束 名 在 这 里 无 关 紧 
要 。3 引 用 通过 属性 refer 来 定义 ， 它 的 值 必须 和 key 或 unique 约 束 的 名 字 一 致 。 在 本 例 中 ， 它 和 
Class 元 素 的 主键 约束 PrimaryKeyForClass 匹 配 。 

在 SQL 中 ， 引 用 的 值 相 当 于 外 键 约束 中 的 REFERENCES 关 系 名 部 分 。 接 下 来 我 们 讨论 一 
下 选择 器 。 在 声明 键 约束 时 ， 选 择 器 通过 它 的 属性 xpath 定 义 源 集 (source collection). mix 
里 所 讨论 的 元 素 集 由 所 有 CrsTaken 元 素 组 成 。 每 一 个 CrsTaken 元 素 都 要 引用 键 约束 
PrimaryKeyForClass 定 义 的 目标 集 (target collection) 中 的 某 个 对 象 的 键 : 

最 后 ， 我 们 来 介绍 一 下 外 键 本 身 ， 即 CrsTaken 元 素 (MH) 内 部 的 各 个 字段 ， 这 些 字 段 
才 真 正 引用 目标 集合 (主键 约束 中 定义 ) 中 的 字段 。 我 们 使 用 大 家 已 经 熟悉 的 field 标 记 来 描 
述 。 和 前 面 一 样 ，field 标 记 提供 了 能 得 到 某 个 值 的 路 径 表达 式 (该 路 径 相对 于 所 选择 的 对 象 
集 )。 我 们 希望 CrsTaken 元 素 的 源 集 属性 CrsCode 和 Semester 能 引用 主键 的 字段 HERE 
Class 元 素 的 目标 集 的 主键 。 在 XPath 中 ， 我 们 使 用 @CrsCode 和 @Semester 来 确定 这 些 属性 
(参见 图 17-9)。 和 组 成 键 的 字段 一 样 ， 源 集中 任何 对 象 上 的 路 径 表 达 式 的 值 必 须 是 唯一 的 。 

相似 地 ， 我 们 可 以 在 报告 文档 中 定义 其 他 的 主键 和 外 键 约束 ， 也 可 以 使 用 数据 类 型 ID 和 
IDREF 楚 换 前 面 的 主键 和 外 键 的 约束 定义 (参见 练习 17.5 和 17.7)。 从 另 一 方面 来 看 ， 没 有 一 
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个 很 好 的 方法 能 够 使 用 key 和 keyref 来 指定 IDREFS 风 格 的 参照 完整 性 。 比 如 ， 元 素 ClassRoster 
(在 17.3.5 节 的 起 始 部 分 ) 的 属性 Members 的 类 型 是 studentIds ，studentIds 是 由 一 系列 
studentRef 类 型 的 值 组 成 的 。 因 为 studentRef 类 型 是 由 基 类 型 IDREF 通 过 施加 限制 而 得 来 的 
(参见 图 17-8)， 所 以 studentIds 可 以 看 作 是 IDREFS 的 一 个 特例 。 我 们 可 以 尝试 使 用 下 面 的 方法 
来 定义 这 种 参照 完整 性 : l 
<keyref name="RosterToStudIdRef" refer="adm:studentKey"> 
<selector xpath="Classes/Class"/> 


<field xpath="ClassRoster/@Members"/> 
</keyref> 


这 里 ，studentKey 是 Student 元 素 的 一 个 主键 约束 。 但 问题 是 ， 属 性 Members 的 值 是 一 个 列表 ， 
而 Student 标 记 的 键 属性 StudId 的 值 却 是 一 个 项 。 而 且 ， 在 XPath 语 言 中 ， 不 可 能 建立 这 样 的 引 
用 ， 引 用 者 是 列表 数据 类 型 (如 属性 Members ) 的 某 个 对 象 ， 而 被 引用 的 是 文档 中 的 其 他 实 
体 〈 也 就 是 Student 元 素 中 定义 的 学 生 Id) 。 能 解决 这 一 问题 的 唯一 方法 就 是 使 得 Members 中 的 
学 生 Id 不 出 现在 列表 中 ， 而 是 以 单 值 的 形式 出 现 (参见 练习 17.9)。 


t 


<schema xmlns="http://www.w3.org/2001/XMLSchema" 
xmlns:adm="http://xyz.edu/Admin"> 
targetNamespace="http://xyz.edu/Admin"> 


<complexType name="courseTakenType"> 
<attribute name="CrsCode" type="adm:courseRef"/> 
<attribute name="Semester" type="string"/> 
</complexType> 
<complexType name="classType"> 
<sequence> 
<element name="CrsCode" type="adm: courseCode"/> 
<element name="Semester" type="string"/> 
<element name="ClassRoster" type="adm:classListType"/> 
</sequence> 
</complexType> 


<complexType name="reportType"> 
<sequence> 
<element name="Students" type="adm:studentList"/> 
<element name="Classes" type="adm:classOfferings"/> 
<element name="Courses" type="adm:courseCatalog"/> 
</sequence> 


<key name="PrimaryKeyForClass"> 
<selector xpath="Classes/Class"/> 
<field xpath="CrsCode"/> 
<field xpath="Semester"/> 

</key> 

<keyref name="NoBogusTranscripts" refer="adm:PrimaryKeyForClass"> 
<selector xpath="Students/Student/CrsTaken"/> 
<field name="e@CrsCode"/> 
<field name="@Semester"/> 

</keyref> 

</complexType> 
</schema> 





图 17-10 带 有 主键 和 外 键 约束 的 模式 的 一 部 分 
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17.4 XML 查询 语言 


为 什么 需要 查询 XML 文档 ? 现 有 的 数据 库 技 术 能 存储 并 发 布 XMEL 吗 ? 

将 XML 数据 存储 在 专门 为 XML 而 设计 的 数据 库 中 ， 已 经 不 成 问题 。 人 们 已 经 找到 能 够 有 
效 地 存储 和 检索 树 结构 的 对 象 ， 当 然 也 包括 XML 文 档 [Deutsch et al.1999, Zhao and Joseph 
2000] 的 办 法 。 然 而 ，XML 文 档 多 半 会 被 映射 成 现 有 的 关系 或 面向 对 象 的 格式 而 被 存储 起 来 。 
另 一 方面 ， 目 前 所 有 主流 DBMS 厂 商 的 产品 都 已 经 兼容 XML 。 它 们 能 够 接受 XML 文档 并 将 
XML 文档 转换 成 关系 或 对 象形 式 ， 并 提供 工具 将 已 有 的 关系 数据 库 或 对 象 数据 库 中 的 数据 转 
换 成 XML 文档 对 外 发 布 。 一 旦 生成 XML 文档 ， 就 可 以 将 它 传递 到 别 的 机 器 上 ， 接 收 到 该 文档 
的 机 器 可 以 自动 地 处 理 它 ， 也 可 以 将 它 呈 现在 用 户 面前 。 为 了 达到 这 一 目的 ，W3C 组 织 ; 
XML 定义 了 文档 对 象 模型 (Document Object Model, DOM) [DOM2000]，DOM 将 客户 端 程 
序 访问 XML 文 档 各 个 部 分 的 接口 标准 化 ， 因 而 简化 了 此 类 程序 的 编写 过 程 。 

XML 查询 语言 和 这 些 有 什么 关系 呢 ? 假设 你 正在 准备 下 个 学 期 的 课程 表 ， 并 需要 找 出 该 
学 期 下 午 3 点 到 ?7 点 的 所 有 课程 。 如 果 大 学 的 数据 库 服务 器 允许 你 进行 这 样 的 查询 ， 那 么 问题 
当然 好 解决 ， 但 更 大 的 可 能 是 ， 数 据 库 仅 提供 了 一 个 的 固定 接口 ， 这 个 接口 仅 只 持 有 限 的 一 
组 查询 。 此 时 ， 要 查找 出 需要 的 结果 ， 你 可 能 需要 填写 一 连 串 的 表单 并 且 靠 眼睛 来 分 析 结 果 ， 
甚至 可 能 需要 使 用 诸如 笔 和 纸 这 样 的 工具 将 一 些 需要 的 信息 记录 下 来 。 

一 种 替代 方案 就 是 ， 向 服务 器 请 求 包 含 本 学 期 所 有 课程 列表 的 XML 文档 ， 并 且 使 用 一 个 
客户 端 程序 找到 想 要 的 信息 。 正 如 前 面 介绍 的 那样 ，DOM 在 很 大 程度 土 简化 了 这 一 过 程 。 尽 
管 如 此 ， 它 提供 的 仅仅 是 底层 的 XML 接口 。 如 果 你 的 查询 需要 联结 存储 在 文档 不 同 部 分 的 信 
息 或 者 存储 在 不 同文 档 中 的 信息 ， 那 么 你 可 能 需要 编 一 大 段 程序 (可 能 等 程序 调试 完 ， 这 个 
学 期 就 将 结束 了 ) 。 一 种 可 行 的 方案 就 是 使 用 嵌 套 循环 和 这 语 句 来 代替 复杂 的 SQL 查询 语句 。 
在 后 面 ， 大 家 将 看 到 一 种 功能 更 强 的 高 级 查询 语言 ， 它 可 以 简化 这 一 查询 过 程 ， 这 种 查询 语 
言 允 许 客户 端 程序 以 智能 、 可 定制 的 方式 来 处 理 信 息 。 

在 本 节 后 面 的 内 容 中 ,我们 将 讨论 XML 的 三 种 查询 语言 : XPath[XPath1999]、XSLT[XSL 
1999] 和 XQuery[XQuery 2001]， 其 中 XQuery 是 W3C 最 近 提 出 的 一 种 XML 查询 语言 并 将 最 终 成 
为 W3C 推 荐 的 官方 查询 语言 ， 它 是 在 Quilt 语 言 的 基础 上 建立 起 来 的 [Chamberlin et 
al.2000,Robie et al.2000]。 

XPath 的 提出 者 希望 XPath 语 言 简单 而 有 效 。 它 建立 在 路 径 表 达 式 的 概念 之 上 (第 16 章 我 
们 已 经 介绍 了 路 径 表 达 式 的 含 又 ) ， 并 被 设计 为 紧凑 的 并 且 可 以 和 UREL 合 并 的 语言 。 将 XPath 
表达 式 和 URL 合 并 是 XPointer 规 范 [XPointer 2000] 的 一 部 分 ， 这 部 分 内 容 我 们 也 将 做 简略 的 介 
绍 。XSLT 是 一 门 成 熟 的 编程 语言 ， 具 有 强大 的 查询 功能 (尽管 有 限 ) 。XQuery 是 一 种 SQL 风 
格 的 查询 语言 ， 它 的 概念 符合 人 们 对 传统 数据 库 查 询 语言 的 理解 。 在 本 章 所 介绍 的 所 有 XML 
查询 语言 中 ，XQuery 是 功能 最 强大 ， 设 计 最 完善 的 一 种 。 


17.4.1 XPath: 一 种 轻 量 的 XML 查 询 语言 


在 面向 对 象 的 语言 (如 OQL， 见 16.4.2 节 ) 中 ， 路 径 表 达 式 就 是 对 象 属性 的 序列 ， 这 个 序 
列 指明 了 到 达 斤 套 在 对 象 结构 内 部 的 数据 元 素 所 需 的 确切 路 径 。 如 果 编 程 者 知道 了 数据 库 的 
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模式 并 且 这 个 模式 改变 的 可 能 性 不 大 的 话 ， 给 出 这 样 的 确定 路 径 并 不 困难 。 然 而 ， 当 数据 库 
模式 不 明确 并 且 数 据 结构 需要 被 挖掘 的 时 候 (在 Web 应 用 中 ， 这 种 情况 是 很 普遍 的 )， 只 采用 
面向 对 象 语言 中 的 路 径 表 达 式 的 概念 是 不 够 的 。 

Xpath 使 用 查询 机 制 扩展 了 路 径 表 达 式 ， 扩 展 的 方法 就 是 将 元 素 路 径 的 一 部 分 用 搜索 条 件 
来 替换 。 在 检查 数据 的 时 候 ，XPath 解 释 器 会 在 运行 时 查找 出 路 径 缺 少 的 部 分 。 这 种 扩展 路 径 
表达 式 的 想法 并 不 是 新 的 ， 这 种 想法 最 早出 现在 [Kifer and Lausen 1989, Kifer et al.1992, 
Frohn et al.1994] 中 的 面向 对 象 数据 库 的 环境 中 ， 并 在 半 结 构 化 数据 的 研究 中 得 以 发 展 ， 这 方 
面 的 著作 有 [Buneman et al.1996,Abiteboul et al.1997, Deutsch et al.1998, Abiteboul et 
al.2000]。XPath 建 立 在 这 些 概念 的 基础 上 ， 并 成 为 许多 XML 扩展 的 重要 基础 。 

1. XPath 数据 模型 

XPath 将 XML 文档 看 作 是 树 ， 将 元 素 、 属 性 、 注 释 和 文本 看 作 是 树 的 节点 。 但 这 里 有 一 点 
要 说 明 ， 那 就 是 树 的 根 节点 并 不 是 XML 文档 的 根 元 素 。 图 17-11 就 阐明 了 这 一 点 ， 它 是 下 列 
XML 文档 对 应 的 树 : 

<?xml version="1.0" ?> 

<!-~- Some comment --> 

<Students> 

<Student StudId="111111111"> 
<Name><First>John</First><Last>Doe</Last></Name> 
<Status>U2</Status> 
<CrsTaken CrsCode="CS308" Semester="F1997"/> 
<CrsTaken CrsCode="MAT123" Semester="F1997"/> 
</Student> 


<Student StudId="987654321"> 
<Name><First>Bart</First><Last>Simpson</Last></Name> 


<Status$U4</Status> 
<CrsTaken CrsCode="CS308" Semester="F1994" /> 
</Student> 
</Students> 
<!-- Some other comment --> 


(该 文档 是 图 17-4 的 报告 文档 的 一 个 片段 。) 

注意 ，XPath 树 的 根 节点 和 对 应 着 文档 的 根 元 素 一 一 Students 元 素 的 节点 不 同 。 从 图 中 可 
以 看 出 ， 我 们 显然 需要 指定 特殊 的 根 节 点 一 一 这 个 特殊 的 根 节点 可 以 将 文档 的 所 有 部 分 包括 
在 内 ， 包 括 允 许 出 现在 根 元 素 以 外 的 地 方 的 注释 。 

和 一 般 的 树 一 样 ， 除 了 根 节点 以 外 ， 所 有 的 节点 都 有 一 个 父 节点 。 节 点 P 出 现在 另 一 节点 
C 的 上 一 层 ， 它 就 是 节点 C 的 父 节 点 ， 而 节点 C 则 是 节点 P 的 子 节点 。 然 而 ，Xpath 规 范 有 一 个 
重要 而 有 时 又 令 人 迷惑 的 特殊 情况 : 属性 不 是 它 的 父 节 点 的 子 节点 。 也 就 是 说 ， 如 果 C 是 P 的 
一 个 属性 ， 那 么 P 是 C 的 父 节 点 ， 但 C 不 是 P 的 子 节点 。 正 是 因为 XPath 这 个 特殊 的 术语 可 能 造 
成 迷惑 ， 我 们 采用 树 结 构 的 标准 术语 ， 认 为 属性 也 是 其 父 元 素 的 一 个 子 节点 。 为 了 避免 概念 
混淆 ， 当 我 们 要 强调 子 元 素 的 特定 类 型 时 ， 有 了 时 也 会 将 它们 分 别称 为 元 素 子 节点 (e-children )、 
属性 子 节点 (a-children) 和 文本 子 节点 (t-children)。 例 如 ，Name 是 Student 的 元 素 子 节点 ， 
StudId 是 Student 的 属性 子 节点 ， 而 John 是 First 的 文本 子 节点 。 当 我 们 既 要 指 元 素 子 节点 又 要 指 
文本 子 节点 时 ， 我 们 称 之 为 元 素 文本 子 节点 (et-children )。 同 样 ，ta-children 指 的 是 文本 属性 
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子 市 点 ， 依 次 类 推 。 





7 pa | # : < 要 > 
图 17-11 XPath 文档 树 


XPath 数据 模型 提供 一 些 操作 来 浏览 文档 的 树 结构 并 访问 树 的 各 个 部 分 。 这 些 操作 包括 访 
问 根 市 点 ， 访 问 节点 的 父 节点 , 访问 节点 的 子 节点 ,访问 节点 的 内 容 ， 访问 属 性 的 值 等 等 。 

讨论 XML 模式 的 约束 的 时 候 ， 我 们 已 经 介绍 了 部 分 操作 。 基 本 的 语法 是 UNIX 操 作 系 统 
的 文件 命名 机 制 : 符号 “/” 表 示 根 节点 ,“.” 表 示 当 前 节点 ,，“..” 表 示 当 前 节点 的 父 节点 。 
XPath 表 达 式 以 文档 树 为 参数 并 返回 树 的 节点 集 。 因 此 ， /Students/Student/CrsTaken 是 一 个 绝 
对 路 径 表达 式 (absolute path expression), 返回 一 组 对 节点 的 引用 ， 这 些 节点 对 应 CrsTaken 
元 素 ， 可 以 从 根 节点 通过 子 节点 Students 以 及 孙 节 点 Student 到 达 该 元 素 。 文 档 树 中 共有 三 个 
这 样 的 元 素 (上 图 中 已 经 给 出 了 其 中 的 一 个 )。 假设 当前 节点 对 应 着 元 素 Name， 那 么 First 
和 ./First 指 的 是 同一 个 子 元 素 。 假 设 当 前 节点 对 应 着 元 素 First， 那么 ../Last 指 的 就 是 元 素 First 
的 兄弟 元 素 Last。 这 些 都 是 相对 路 径 表达 式 (relative path expression )， 因 为 它们 都 不 是 从 根 
节点 开始 的 。 

为 了 能 访问 属性 ， 我 们 使 用 符号 “@”。 比 如 ， 我 们 可 以 使 用 路 径 /Students/Student/ 
CrsTaken/@CrsCode 来 获得 上 述 XML 文 档 中 属性 CrsCode 的 值 的 集合 。 在 本 例 中 ， 这 样 的 
CrsCode 的 值 有 两 个 : CS308 和 MAT123。 文 本 节点 可 以 使 用 text() 函 数 来 访问 。 比 如 ， 
/Students/Student/Name/First/text() 表 示 的 是 这 样 的 节点 集 ， 其 中 每 一 个 成 员 都 表示 一 个 First 类 
型 元 素 的 文本 内 容 。 本 例 中 ,我们 有 两 个 这 样 的 节点 ， 一 个 是 John， 另 一 个 是 Batt。 如 果 你 要 
得 到 文档 中 的 两 个 注释 ， 那么 你 可 以 使 用 路 径 /comment0 函 数 来 实现 。 

2. XPath 中 的 高 级 导航 

XPath 导航 中 的 高 级 特性 包括 选择 XML 文档 中 的 特定 的 节点 和 跳 过 不 定数 量 的 子 节点 。 例 
如 ， 要 找 出 John Doe 选 修 的 第 二 门 课 ， 我 们 使 用 路 径 /Students/Student[1]/CrsTaken[2] ix H 
[选择 文档 树 中 两 个 Student 节 点 中 的 第 一 个 节点 ， 路 径 /Students/Student[1]/CrsTaken 选 出 第 
一 个 Student 节 点 下 所 有 的 CrsTaken 节 点 ， 最 后 ， [2] 指 明 选 择 的 是 这 些 节 点 中 的 第 二 个 节点 。 


图 例 : 
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另 一 个 例子 用 于 选择 某 个 特定 的 元 素 的 表达 式 是 /Students/Student/CrsTaken[last()]， 它 的 作用 
机 制 和 上 面 的 例子 一 样 ，/Students/StudenUCrsTaken 选 出 所 有 的 CrsTaken 节 点 ， 而 flastO] 则 选 
出 按 标 准 的 XML 节 点 顺序 排序 的 节点 中 的 最 后 一 个 (标准 的 XML 节 点 硕 序 是 按 文档 树 深度 优 
先 遍 历 各 节点 形成 的 顺序 )。 在 本 例 中 ， 它 得 到 的 结果 是 

<CrsTaken CrsCode="CS308" Semester="F1994"/> 

有 时 候 ， 我 们 不 知道 文档 的 确切 结构 ， 或 者 指定 准确 的 导航 路 径 比 较 麻 烦 ， 因 此 XPath 提 
供 几 种 通配符 机 制 。 一 种 是 descendant-or-self 操 作 (用 “//” 表 示 )， 例 如， 路 径 //CrsTaken 选 
择 的 是 整个 树 中 所 有 的 CrsTaken 元 素 。 本 例 中 ， 它 的 结果 和 /Students/Student/CrsTaken 产 生 的 
结果 是 一 样 的 。 然 而 ， 如 果 XML 文 档 的 不 同 深度 和 不 同 元 素 类 型 下 都 有 CrsTaken 元 素 ， 那 么 
不 使 用 通配符 机 制 来 选 出 所 有 这 样 的 元 素 是 很 困难 的 ， 也 是 不 明智 的 。 

descendant-or-self 操 作 也 可 以 用 在 相对 路 径 中 。 例 如 ，.//CrsTaken 将 在 当前 节点 的 所 有 子 
孙 节 点 中 寻找 CrsTaken 元 素 ?。XPath 同 样 允许 访问 给 定 节 点 的 祖先 节点 (HA. HAHA 
等 等 )， 这 里 我 们 不 介绍 这 一 特性 。 . 

通配符 * 可 以 让 我 们 选择 一 个 节点 的 所 有 元 素 子 闻 点 (不管 类 型 如 何 )。 例 如 ，Student/* 
将 选 出 当前 节点 的 子 节点 Student 的 所 有 元 素 子 节点 〈 本 例 中 ， 当 前 节点 是 Students 节 点 ， 上 述 
路 径 将 选 出 2 个 Name 节 点 、2 个 Status 节 点 和 3 个 CrsTaken 节 点 )， 而 表达 式 /*//* 将 选 出 根 的 所 
有 元 素 孙子 节点 ， 以 及 孙子 节点 的 所 有 元 素 后 代 节 点 。 

通配符 * 也 可 以 用 于 属性 。 例 如 ，CrsTaken/@*#* 将 选择 当前 节点 下 一 层 的 CrsTaken 节 点 的 
所 有 属性 。 注意， 通配符 * 不 能 包括 文本 节点 〈 如 ，Student 元 素 子 节点 中 的 文本 节点 )。 要 选 
树 Student 市 点 的 文本 子 节 点 ， 我 们 需要 使 用 表达 式 Student/text()。 

3. XPath 查询 

我 们 特别 关心 的 是 XPath 中 使 用 查询 来 选择 节点 的 相关 特性 。XPath 查 询 语句 允许 将 一 定 
的 查询 条 件 放 在 路 径 表 达 式 的 任何 一 个 步骤 中 。 下 面 我 们 会 给 出 关于 图 17-4 的 报告 文档 的 几 
个 带 有 查询 的 XPath 表 达 式 。 

下 面 的 路 径 表 达 式 查找 所 有 选修 1994 年 下 半年 课程 的 学 生 列 表 。 

//Student [CrsTaken/@Semester = "F1994"] 

这 里 我 们 使 用 了 符号 “//Student”， 它 选 出 根 节点 的 所 有 后 代 节 点 Stadent。“[]” 中 括 起 来 
的 表达 式 叫 做 选择 条 件 (selection condition)， 它 仅仅 选 树 那些 特定 的 Student 节 点 ， 在 这 些 
Student 节 点 上 能 够 应 用 路 径 表 达 式 CrsTaken/@Semester 并 且 表 达 式 返回 的 集合 中 包括 F1994® 。 
为 了 基于 元 素 内 容 而 不 是 属性 来 选择 元 素 ， 我 们 可 以 使 用 下 面 的 表达 式 


//Student (Status = "U3" and starts-with(.//Last, "P") 
and not(.//Last = .//First)] 


从 这 个 例子 中 我 们 可 以 了 解 到 XPath 的 几 个 特性 。 第 一 ， 选 择 条 件 可 以 是 一 个 由 and、or 和 not 


© 注意 ，./CrsTaken 和 CrsTaken 是 一 样 的 。 但 是 .WCrsTaken、CrsTaken 和 CrsTaken 是 不 同 的 。 第 一 个 表达 式 
返 同 当前 节点 的 所 有 CrsTaken 后 代 ， 第 二 个 表达 式 只 返回 当前 节点 的 CrsTaken 子 节点 ， 第 三 个 表达 式 返 回 
文档 中 所 有 CrsTaken 元 素 。 

© 注意 ， 如 果 Student 节 点 有 几 个 CrsTaken 子 节点 ， 那 么 路 径 表 达 式 CrsTaken/@Semester 返 回 一 个 节点 集合 。 
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组 合 而 成 的 表达 式 。 第 二 ， 基 于 子 节点 或 后 代 节点 的 内 容 进 行 节点 查询 时 ， 只 要 将 路 径 表 达 
式 等 价 地 替换 为 另 一 个 表达 式 或 常量 即 可 。 第 三 ，XPath 语 言 有 丰富 的 函数 库 ， 该 函数 库 提供 
的 各 种 函数 极 大 地 提高 了 XPath 路 径 表 达 式 的 表达 能 力 。 关 于 这 些 函 数 的 详细 介绍 ， 大 家 不 妨 
参阅 XPath 的 规范 [XPath 1999]。 

在 上 例 中 ， 我 们 使 用 函数 starts-with 选 择 姓 的 第 一 个 子 母 是 P 的 学 生 。 简 言 之 ， 上 面 的 例 
子 选 择 所 有 状态 为 3、 姓 的 第 一 个 子 母 是 P 且 姓 和 名 不 同 的 学 生 。 在 其 他 的 字符 串 操作 函数 
中 ， 有 的 用 于 判断 包含 问题 ， 有 的 用 于 执行 字符 串 连 接 ， 有 的 用 于 判断 字符 串 的 长 度 等 等 。 
例如 ， 下 面 的 查询 能 找 出 所 有 名 字 中 包含 van 的 学 生 。 

//Student [contains(concat (Name//text()), "van")] 

这 里 ，Name//text0) 返 回 Name 元 素 下 的 所 有 文本 节点 ， 而 连接 函数 将 这 些 文本 连接 为 一 个 
文本 ， 即 将 学 生 的 姓 和 名 连接 起 来 ， 然 后 再 检查 姓名 中 是 否 包含 字符 串 “van”。 

XPath 语 言 中 定义 的 聚合 函数 有 sum() 和 count()。 例 如 ， 下 面 的 例子 选 出 至 少 选修 了 5 门 课 
的 学 生 名 单 : 

//Student [count (CrsTaken) &gt;= 5] 

在 本 例 中 ，CrsTaken 返 回 当前 节点 (必须 为 Student 节 点 ) 的 CrsTaken 类 型 的 元 素 子 节点 集合 。 
因此 ，count(CrsTaken) 返 回 的 是 某 个 Student 的 所 有 CrsTaken 的 个 数 ， 这 个 数 将 和 5 进行 比较 。 
符号 “&gt;=” 表 示 “> ”。 这 样 表 示 是 由 于 “>” 和 “<” 必 须 被 转译 为 “&gt” 和 “&gt”， 
因为 这 些 符 号 是 作为 标记 的 分 隔 符 而 被 保留 的 。 

值得 注意 的 是 ， 选 择 条 件 可 以 出 现在 路 径 表 达 式 的 各 个 不 同 的 层次 ， 也 可 以 多 次 出 现在 
路 径 表达 式 中 ， 因 此 ， 下 面 的 表达 式 是 合法 的 : 

//Student [Status="U4"] /CrsTaken [@CrsCode="CS305"] 

这 个 表达 式 选 择 文档 中 所 有 的 CrsTaken 元 素 ， 但 它 必 须 满足 两 个 条 件 ， 即 它 的 父 节 点 Student 
的 属性 Status 必 须 为 U4 以 及 它 的 属性 CrsCode 的 值 必须 为 CS305。 

路 径 表 达 式 的 同一 层 中 也 可 以 有 多 个 选择 条 件 ， 正 如 下 面 的 表达 式 那 样 。 下 面 的 表达 式 

找 出 所 有 在 1994 年 秋天 选修 了 课程 MAT123 的 学 生 : 


//Student [(CrsTaken/@CrsCode="MAT123"] 
[CrsTaken/@Semester="F1994"] 


这 个 表达 式 等 同 于 : 


//Student [(CrsTaken/@CrsCode="MAT123" 
and CrsTaken/Semester="F1994"] 


or 运算 也 可 以 在 条 件 表 达 式 中 使 用 ， 如 CrsTaken/@CrsCode=“MAT123” or 
CrsTaken/@Semester=“F1994” 也 是 合法 的 。 

//Student [CrsTaken/@Grade] 

选择 条 件 还 有 另 一 种 有 趣 的 形式 。 假 设 Grade 是 CrsTaken 的 一 个 可 选 的 属性 ， 那 么 表达 式 
//Student[CrsTaken/@Grade] 将 选 出 所 有 这 样 的 Student 节 点 ， 其 子 节点 CrsTaken 的 属性 Grade 必 
须 存 在 。 同样 ， 


//Student [Name/First or CrsTaken] 
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则 选 出 所 有 这 样 的 Student 节 点 ， 它 要 么 有 孙子 节点 First， 要 么 有 子 节 点 CrsTaken。 

最 后 ， 在 SQL 中 可 以 进行 UNION 和 EXCEPT 等 代数 查询 操作 。 作 为 一 门 简单 的 语言 ， 
XPath 只 人 允许 union 操 作 ， 该 操作 用 “| ”表示 ， 如 下 面 的 表达 式 所 示 : 

//CrsTaken[@Semester="F1994"] | //Class[Semester="F1994"] 

这 个 查询 所 选择 的 结果 是 所 有 属性 Semester 的 值 为 “F1994” 的 CrsTaken 节 点 和 所 有 子 节 点 
Semester 的 值 为 “F1994” 的 Class 节 点 的 组 合 。 这 个 例子 也 表明 了 路 径 表达 式 返 回 的 集合 可 以 
包含 不 同类 型 的 元 素 。 

4. XPointer 一 一 一 种 智能 的 URL 

虽然 XPath 拥 有 这 么 多 的 特性 ， 但 它 并 不 是 一 种 表达 能 力 强大 的 语言 。 它 不 能 表达 联结 操 
作 ， 且 只 适合 于 树 结 构 文 档 的 导航 。 然 而 ， 正 是 它 的 这 一 缺点 ， 使 得 XPath 成 为 许多 XML 应 
用 的 给 和 部件。 在 17.3.5 节 中 ， 我 们 就 在 XML 模 式 中 使 用 了 XPath 来 表达 约束 。XPath 还 经 常 
用 简单 的 查询 机 制 来 丰富 URL。 为 此 ， 人 们 已 经 提出 了 许多 XPath 的 扩展 ， 这 些 扩展 将 在 W3C 
组 织 即 将 推出 的 XPointer 中 得 以 标准 化 。 

XPointer 由 URL 和 XPath 发 展 而 来 。 为 了 理解 XPointer 的 使 用 方式 ， 我 们 假设 某 篇 文档 中 
需要 创建 一 个 能 连接 到 另 一 篇 文档 特定 位 置 的 超 链接 。 这 种 链接 在 现在 的 HTML 文 档 中 很 党 
见 (一 个 典型 的 例子 就 是 内 容 的 目录 ， 当 点 击 了 目录 中 的 一 个 链接 ， 用 户 就 能 进入 相应 的 章 
7). 在 HTML 中 ,假如 需要 链接 到 一 篇 文档 的 中 间 部 分 ， 那 么 就 将 这 个 特殊 部 分 用 销 点 标 
识 9 ， 比 如 ， 被 链接 的 部 分 是 interesting-place， 那 么 使 如 下 的 URLdocument-url#interesting- 
Place 就 能 将 用 户 引导 到 interesting-place 部 分 。 问 题 是 ， 只 有 文档 的 作者 预先 创建 好 适当 的 销 
点 后 ， 我 们 才能 创建 这 样 的 链接 ， 但 一 般 来 说 ， 外 部 的 文档 浏览 者 是 不 能 随便 在 文档 的 某 些 
感 兴趣 的 地 方 标记 销 点 的 。 

这 就 是 要 引入 XPath 的 原因 了 。 如 果 我 们 将 URL 和 路 径 表 达 式 能 够 连接 起 来 使 有 用， 那么 上 
述 问 题 就 得 到 解决 了 。 浏 览 者 可 以 先 使 用 URL 检 索 到 这 篇 文档 ， 然 后 使 用 路 径 表 达 式 找 出 需 
要 链接 到 的 地 方 。 这 就 是 XPointer 语 言 ， 其 表达 式 的 一 般 形式 是 : 

someURL#xpointer (XPath 表 达 式 1 )xpointer (XPath 表 达 式 2 )… 

这 种 表达 式 的 处 理 过 程 为 : 首先 找 出 Some URL 指 定 的 文档 , 然后 根据 它 计 算出 XPath 表 达 式 1， 
如 果 它 返回 的 是 一 个 非 空 的 树 节 点 集合 ， 那 么 该 地 址 就 是 需要 链接 到 的 锚 点 ， 否 则 计算 XPath 
表达 式 2， 如 果 它 仍 返 回 一 个 空 集合 ， 那 么 计算 第 三 个 XPath 表 达 式 ， 以 此 类 推 。 举 个 例子 ， 
假设 图 17-4 的 文档 的 URL 为 http://www.foo.edu/Report.xml， 那 么 下 面 的 表达 式 直 接 链 接 到 第 
二 个 学 生 信息 : 

http://www . foo. edu/Report .xml#xpointer (//Student [2] ) 

如 果 没 有 XPath 的 查询 节点 的 语言 能 力 ， 那 么 XPointer 语 言 的 功能 就 要 减 半 。 比 如 ， 有 了 
XPath， 很 容易 地 就 能 找到 选修 了 1994 年 秋天 开设 的 MAT123 课 程 的 学 生 信 息 : 


http://www .foo.edu/Report .xml# 
xpointer (//Student [CrsTaken/@CrsCode="MAT123" 
and CrsTaken/@Semester="F1994"] ) 


© 在 HTML 中 ， 这 是 利用 标记 <A name = "…"> 指 定 的 。 
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(上 面 的 表达 式 应 该 号 在 同一 行 ， 它 之 所 以 占据 了 好 几 行 是 因为 版 面 的 限制 。) 
总 结 一 下 ， 我 们 介绍 了 XPointer 对 XPath 的 几 种 扩展 ， 其 中 还 有 一 些 扩展 这 里 没有 介绍 ， 
比如 指定 文档 节点 的 范围 ， 感 兴趣 的 读者 可 以 参考 [XPointer2000]。 


17.4.2 XSLT: XML 的 一 种 转换 语言 


XSLT (XSL Transformation) 是 一 种 转换 语言 ， 也 是 XSL (XML 的 可 扩展 样式 语言 ) 的 
一 部 分 。 它 的 最 初 目 的 只 是 将 XML 文档 转换 为 HTML 格 式 ， 以 便 用 常见 的 浏览 器 查看 文档 。 
事实 上 它 可 以 把 XML 源 文档 转换 成 任何 类 型 的 文档 (HTML、XML 以 及 纯 文本 )。 因 为 XSLT 
具有 这 种 能 力 ， 所 以 它 可 以 用 来 查询 XML 文档 。 

作为 一 种 查询 语言 ，XSLT 不 同 于 本 书 中 已 经 提 到 过 的 其 他 查询 语言 。 第 6 章 描述 的 关系 
代数 是 一 种 命令 式 (imperative) 语言 ， 它 的 查询 是 一 系列 为 了 得 到 结果 而 必须 执行 的 有 序 操 
作 。 第 6 章 和 第 7 章 中 提 到 的 SQL 和 QBE 是 基于 谓词 逻辑 的 子 集 一 一 关系 演算 的 ， 因 此 它们 属 
于 描述 性 语言 (有 时 也 称 为 逻辑 编程 语言 )。 第 16 章 讨论 的 ODMG 的 面向 对 象 查 询 语言 OQL 也 
属于 这 一 类 。 

在 这 些 语言 中 ， 用 户 必 须 给 数据 库 源 指定 必需 的 信息 和 信息 之 间 的 联系 ， 系 统 从 数据 库 
源 中 获得 这 些 信息 。 另 一 方面 ，XSLT 是 使 用 XML 语 法 的 功能 性 程序 设计 语言 (functional 
programming language)。 和 SQL 类 似 (和 关系 代数 不 同 )， 用 户 间 接 指定 需要 的 结果 ， 但 是 ， 
这 个 结果 是 用 一 个 递归 函数 集 而 不 是 基于 逻辑 的 语言 (如 关系 演算 ) 来 指定 的 。 基 于 功能 性 
程序 设计 的 查询 语言 几乎 和 那些 基于 代数 和 逻辑 的 查询 语言 一 样 古老 [Shipman 1981]。 然 而 ， 
在 XSLT 之 前 ， 它 们 在 数据 库 世 界 里 很 难得 到 一 块 立足 之 地 。 

XSLT 只 是 XSL 的 两 个 组 成 部 分 之 一 。 另 一 个 是 格式 化 语言 (formatting language)， 它 指 
定 了 一 个 文档 在 浏览 器 或 纸 上 显示 时 的 外 观 。 显 示 一 个 XML 文 档 的 主要 过 程 是 将 该 XML 文 档 
转变 为 另 一 个 文档 ， 这 个 文档 在 原来 的 XML 文档 基础 上 增加 了 显示 方面 的 指令 。 结 果 可 能 捷 
失 一 些 原 始 内 容 〈 例 如 ， 为 使 文档 能 在 诸如 Palm Pilot 的 PDA 中 使 用 )， 也 可 能 会 得 到 一 些 额 
外 信息 (例如 ， 一 个 内 容 目 录 )。 在 使 用 了 XSL 格 式 化 语言 后 ， 输 出 文档 将 是 可 以 被 一 些 浏览 
器 或 者 文字 处 理 器 显示 的 XML 格式 。 而 XSLT 可 以 被 单独 使 用 ， 来 把 输入 的 XML 文档 转换 成 
一 种 完全 不 同 的 格式 ， 例 如 HTML (可 以 用 常见 的 浏览 器 显示 ) 或 LaTex (适用 于 高 质量 的 论 
文 文档 )。 

格式 化 不 是 本 节 要 讨论 的 主题 。 我 们 将 着 重 讨论 XSLT， 尤 其 是 它 作 为 查询 语言 的 使 用 。 
此 外 ， 我 们 会 关注 XSLT 查 询 功 能 中 最 吸引 人 之 处 一 一 基于 模式 的 文档 转换 ， 读 者 可 以 在 
[Kay2000, XSL1999] 中 查 到 XSLT 的 详细 信息 。 

1. XSLT 基 础 

一 个 XSLT 程 序 (通常 称 为 样式 表 ) 指定 了 从 一 种 类 型 的 文档 到 另 一 种 类 型 的 转换 。 像 以 
前 一 样 ， 我 们 将 通过 图 17-4 中 的 报告 文档 来 说 明 它 的 各 种 特性 。 为 了 处 理 一 个 文档 ，XML 处 
理 器 需要 知道 相应 的 样式 表 的 位 置 。 这 个 位 置 由 xml-stylesheet 处 理 指令 来 指定 ， 它 必须 出 现 
在 文档 的 序言 (preamble) 部 分 ， 在 初始 的 <?xml…?> 指 令 和 第 一 个 XML 标记 之 间 。 例 如 ,为 
了 给 我 们 的 报告 提供 一 个 样式 表 ， 文 档 开 头 应 访 如 下 所 示 : 
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<?xml version="1.0" ?> 

<?xml-stylesheet type="text/xsl" 
href="http://xyz.edu/Report/report.xsl" ?> 

<Report Date="2000-12-12"> 


</Report> 


xml-stylesheet 指 令 中 的 type 属 性 指明 样式 表 是 一 个 XSL 文 本 文件 ， 所 以 XML 处 理 器 能 够 
选择 合适 的 解析 器 。href 属 性 指明 样式 表 的 位 置 。 处 理 器 就 可 以 从 指定 位 置 取得 样式 表 并 且 相 
应 地 转换 文档 格式 。 

下 面 是 一 个 样式 表 的 例子 ， 它 可 以 从 一 个 报告 (例如 图 17-4 中 的 报告 ) 中 提取 出 所 有 学 
生 的 列表 : 


<?xml version="1.0" ?> 
<StudentList xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
xsl: version="1.0"> 
<xsl:copy-of select="//Student/Name"/> 
</StudentList> 


我 们 的 报告 在 使 用 这 个 样式 表 定 义 的 转换 后 结果 如 下 : 


<StudentList> 、 
<Name><First>John</First><Last>Doe</Last></Name> 
<Name><First>Joe</First><Last>Public</Last></Name> 
<Name><First>Bart</First><Last>Simpson</Last></Name> 
</StudentList> 


一 个 样式 表 由 显示 格式 样 例 〈 它 是 在 样式 表 中 定义 的 标记 ， 在 此 例 中 是 StudentList) 和 
XSLT 指 令 (例如 copy-of) 组 成 。 样 例 被 简单 地 复制 到 结果 文档 中 ， 而 指令 从 源 文档 中 提取 数 
据 项 ， 并 将 其 放置 到 结果 文档 中 。 注 意 ， 当 把 我 们 的 样式 表 看 作 XML 文 档 时 ， StudentList 是 
它 的 根 标记 。 和 大 多 数 XML 文 档 一 样 ， 样 式 表 的 根 标 记 包含 命名 空间 的 声明 。StudentList 也 
包含 XSLT 需 要 的 version 属 性 (XSLT 强 制 的 属性 和 命名 空间 声明 不 复制 到 结果 文档 中 )。 

xmlns 声 明 将 前 缀 xsl (XSLT 惯 用 的 一 个 前 级) 和 定义 XSLT 词 汇 表 的 标准 命名 空间 关联 起 
来 。 这 个 词汇 表 包 括 copy-of 和 其 他 我 们 马上 就 会 看 到 的 XSLT 指 令 。 由 于 一 些 原因 ， 我 们 不 能 
把 XSLT 的 命名 空间 作为 默认 的 命名 空间 。 如 果 这 样 做 ，StudentList 将 属于 这 个 命名 空间 ( 根 
据 命 名 空间 声明 的 范围 规则 )。 然 而 ， 这 个 标识 符 在 命名 空间 http://www.w3.org/1999/XSL/ 
Transform 中 并 不 存在 ， 事实 上 ， 它 只 是 在 此 例 中 作为 结果 文档 的 顶层 标记 而 创造 的 。 

copy-of 语 句 是 一 个 XSLT 指 令 , 其 功能 只 是 复制 其 select 属 性 中 的 XPath 表达 式 选 出 的 元 素 。 
在 我 们 的 例子 中 ， 路 径 表 达 式 选择 所 有 Student 的 子 节点 的 Name 元 素 ， 产 生 了 上 面 显示 的 
Name 元 素 的 列表 。 

XSLT 包 含 一 些 条 件 指 令 和 循环 指令 ， 例 如 if (一 个 没有 “else” 的 “if-then”)、choose 
(C/C++ 和 Java 中 的 switch 语 旬 的 增强 版 本 ) 和 for-each。 下 面 是 一 个 使 用 了 共 中 一 部 分 特性 的 
例子 : 


<?xml version="1.0" ?> 
<StudentList xmlns:xsl="http://www.w3.org/1999/XSL/Transf orm" 
xsl: version="1.0"> 
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<xsl:for-each select="//Student"> 
<xsl:if test="count(CrsTaken) &gt; 1"> 
<FullName> 
<!-- Last ts two levels below Student ; use * to skip one level --> 
<xsl:value-of select="*/Last"/>, 
<xsl:value-of select="*/First"/> 
</FullName> 
</xsl:if> 
</xsl1:for-each> 
</StudentList> 


对 我 们 的 报告 应 用 这 个 转换 后 的 结果 如 下 : 


<StudentList> 
<FullName> 
Doe, John 
Public, Joe 
</FullName> 
</StudentList> 


for-each 语 句 选择 了 被 相应 路 径 表达 式 指定 的 所 有 节点 (在 我 们 的 例子 中 是 所 有 Student 元 
素 的 集合 ) ， 并 且 对 这 些 节 点 应 用 所 有 出 现在 foreach 元 素 中 的 语句 。 对 每 个 学 生 而 言 ， 这 个 
程序 首先 检查 这 个 学 生 是 否 修 完 多 于 一 门 的 课程 〈 像 前 面 讨论 的 那样 ， 我 们 必须 把 “>” 表 示 
为 “&gt;”)。 我 们 的 文档 中 只 有 两 个 学 生 满足 这 个 条 件 : John Doe 和 Joe Public， 对 于 每 个 人 ， 
显示 格式 样 例 的 标记 <FullName>…</FullName> 被 从 样式 表 复制 到 结果 文档 。 

下 一 步 ， 我 们 打破 报告 中 Name 元 素 的 结构 ， 从 中 提取 出 姓 和 名 ， 丢 弃 掉 标记 。 学 生 名 以 
无 结构 的 文本 形式 显示 。 抽 取 一 个 元 素 的 文本 内 容 是 使 用 XSLT 指 令 value-of 达 到 的 ， 它 类 似 
于 copy-of， 不 同 之 处 在 于 它 只 提取 元 素 的 内 容 而 不 提取 元 素 本 身 。 如 果 我 们 使 用 copy-of 而 不 
是 value-of， 那 么 将 会 有 不 同 结果 : — 


<StudentList> 
<FullName> 
<Last>Doe</Last>, <First>John</First> 
<Last>Public</Last>, <First>Joe</First> 
</FullName> 
</StudentList> 


2. XSLT 模 板 

XSLT 的 过 程 化 特性 看 似 强 大 ， 但 它们 并 不 足以 处 理 所 有 的 XML 文 档 。 问 题 在 于 尽管 for- 
each 指 令 可 以 和 迭代 路 径 表 达 式 选择 的 所 有 元 素 ， 但 是 它 不 能 递归 访问 下 面 的 元 素 并 用 递归 方 
法 转换 文档 。 因 为 XML 文档 可 以 是 任意 的 深度 ， 所 以 结构 的 递归 遍历 对 提取 希望 的 信息 是 必 
需 的 。 对 XML 树 的 遍历 由 基于 模式 的 模板 ( pattern-based template) 提供 。 先 前 描述 的 
StudentList 样 式 表 使 用 了 一 种 简单 的 语法 ， 这 种 语法 是 下 面 这 个 模板 的 简化 : 

<?xml version="1.0" ?> 

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 

xsl: version="1.0"> 
<xsl:template match="/"> 


<StudentList> 
<xsl:for-each select="//Student"> 
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</xs1:for-each> 
</StudentList> 
</xsl:template> 
</xs1:stylesheet> 


事实 上， 在 这 里 老 的 样式 表 用 <xsl:template match=“/”>…</xsl:template> 标 记 对 包 了 起 
来 ， 它 们 说 明 标记 对 之 间 的 显示 格式 样 例 部 分 和 样式 表 中 的 指令 都 应 该 应 用 在 文档 根 节点 下 。 

一 个 XSLT 模 板 是 一 个 转换 函数 ， 经 常 根据 其 他 的 模板 递归 定义 。 在 模板 内 部 ， 它 可 以 使 
用 我 们 已 经 见 过 的 过 程 化 特性 (如 copy-of、foreach 等 )， 也 可 以 调用 其 他 的 模板 。 有 趣 的 是 ， 
模板 通常 不 直接 被 调用 ， 而 是 当 它们 的 XPath 表达 式 与 文档 树 中 当前 节点 匹配 时 才 被 调用 s 。 
图 17-12 显 示 了 一 个 与 先前 的 样式 表 功 能 相同 的 模板 程序 ， 而 上 个 模板 程序 是 用 for-each 语 句 
实现 的 。 尽 管 新 的 样式 表 比 原来 的 样式 表 复杂 ， 但 是 它 也 足够 简明 并 且 能 阐明 主要 的 思想 。 


<?xml version="1.0" ?> 
<xsl:stylesheet xmlns:xsl="http: //www.w3.org/1999/XSL/Transforn" 
xsl: version="1.0"> 
<xsl:template match="/"> 
<StudentList> 
<xsl:apply-templates/> 
</StudentList> 
</xsl:template> 
<xsl:template match="//Student"> 
<xsl:if test="count(CrsTaken) &gt; 1"> 
<FullName> 
<xsl:value-of select="*/Last"/>, 
<xsl:value-of select="*/First"/> 
</FullName> 
</xs1:if> 
</xsl:template> 
<xsl:template match="text()"> 
<!-- Empty template --> 
</xsl:template> 
</xsl:stylesheet> 





图 17-12 递归 样式 表 


计算 开始 时 将 图 17-11 中 文档 树 的 根 节点 和 每 个 模板 中 match 属 性 指定 的 路 径 表 达 式 进行 
匹配 。 在 我 们 的 例子 中 ， 匹 配 根 的 唯一 路 径 表 达 式 是 第 一 个 模板 中 的 “/”。 这 个 模板 首先 发 
布 StudentList 标 记 对 ， 设 置 当前 节点 为 树 的 根 节 点 ， 然 后 用 apply-templates 指 令 递归 调用 其 他 
的 模板 。 这 个 调用 的 结果 会 插入 到 StudentList 标 记 对 之 间 。 

apply-templates 指 令 驱动 对 文档 树 的 递归 遍历 。 它 构造 了 当前 上 下 文 节点 的 所 有 元 素 文本 
子 节点 (忽略 属性 节点 ) 集合 ， 并 且 对 每 个 子 节点 应 用 一 个 匹配 的 模板 e。 

根 节 点 唯一 的 元 素 文本 子 节点 是 Students 元 素 ， 因 为 我 们 的 样式 表 中 没有 一 个 模板 匹配 此 
节点 ， 所 以 我 们 好 像 进 入 了 一 个 死胡同 。 为 避免 这 种 情况 ， 我 们 可 以 指定 下 面 的 模板 : 


O XSLT 也 有 已 命名 的 模板 ， 它 们 是 显 式 调用 的 。 但 我 们 不 讨论 这 种 机 制 。 
O 这 些 模板 应 用 时 互 不 相关 ， 但 是 结果 按照 子 节点 在 XML 树 中 出 现 的 顺序 输出 。 
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<xsl:template match="*|/"> 
<xsl:apply-templates/> (17.2) 
</xsl:template> 


这 个 模板 匹配 所 有 的 e-node (因为 “*”) 和 根 节点 (因为 “/”)。 幸 运 的 是 ， 在 没有 其 他 
模板 匹配 当前 元 素 节点 时 ，XSLT 会 自动 调用 这 个 默认 的 模板 ， 所 以 我 们 不 需要 显 式 指定 它 
(文本 节点 和 属性 节点 的 默认 模板 是 不 同 的 ， 下 面 会 解释 这 一 点 )。 上 面 的 默认 模板 不 发 布 任 
何 东西 ， 只 是 继续 对 报告 的 元 素 文 本 子 节点 (Students、Classes、Courses) 应 用 模板 。 这 个 
递归 过 程 在 遍历 文档 树 的 Classes 和 Courses 分 支 时 会 进入 死胡同 ， 但 是 在 遍历 Students 分 支 时 
会 产生 有 用 的 结果 。 | 

让 我 们 先 考虑 一 下 对 Students 分 支 的 转换 。 因 为 我 们 的 样式 表 中 没有 模板 匹配 Students， 
所 以 会 再 次 应 用 默认 规则 。 它 引导 XML 处 理 器 对 三 个 Students 子 元 素 应 用 匹配 的 模板 。 很 幸 
运 ， 我 们 这 次 有 了 一 个 相 匹配 的 显 式 模板 一 一 样式 表 的 第 二 个 模板 。( 这 个 模板 的 实际 转换 与 
我 们 前 面 讨论 的 使 用 了 for-each 指 令 的 样式 表 相 同 。) 

对 Classes 和 Courses 两 个 分 支 的 转换 的 过 程 相似 ， 所 以 我 们 只 考虑 Classes 分 支 。 因 为 没有 
模板 显 式 匹配 Classes ， 所 以 XSLT 应 用 默认 的 模板 ， 它 又 对 元 素 文本 子 节点 应 用 模板 。 注 意 ， 
默认 的 模板 忽视 属性 和 文本 节点 。 然 而 ， 当 它 应 用 到 CrsCode 和 Semester 节 点 时 (Classes 的 子 
孙 )， 它 们 的 文本 子 节点 将 会 受到 apply-templates 语 句 的 影响 。 这 个 问题 是 由 于 XSLT 还 有 一 个 
可 以 应 用 到 属性 和 文本 节点 的 默认 模板 而 造成 的 : 


<xsl:template match="text() |@*"> 
<xsl:value-of select="."/> 
</xsl:template> 


这 意味 着 ， 当 这 个 模板 匹配 一 个 属性 或 文本 节点 时 ， 属 性 或 文本 值 被 处 理 器 复制 到 结果 
文档 中 。 但 是 ， 在 我 们 的 例子 中 ， 它 产生 了 我 们 不 需要 的 表示 学 期 和 课程 代码 的 错误 文本 
(我 们 只 需要 学 生 的 名 字 )。 

第 三 ， 加 入 图 17-12 的 样式 表 中 的 空 模板 可 以 解决 这 个 问题 。 这 个 筑 板 只 匹配 文本 节点 并 
且 什 么 也 不 发 布 ( 在 这 里 我 们 不 需要 考虑 属性 ， 因 为 <xsl:apply-templates> 忽 视 所 有 当前 节点 
的 属性 子 节 点 )。 因 为 我 们 有 一 个 显 式 的 规则 匹配 文本 节点 ， 所 以 就 不 会 再 使 用 这 些 节点 的 默 
认 规 则 。 

因为 XSLT 中 有 大 量 可 用 的 特性 ， 所 以 对 文档 应 用 样式 表 的 算法 非常 复杂 ， 连 W3C 提 出 的 
标准 [XSL 1999] 都 没有 关于 它 的 详细 描述 。 这 里 我 们 提供 一 个 用 于 简化 的 基于 模式 的 模板 的 
计算 过 程 的 概要 ， 这 些 简 化 的 模板 至 多 在 结果 文档 增加 一 个 元 素 节 点 并 且 可 能 调用 apply- 
templates。 特 别 地 ， 我 们 去 掉 了 for-each 循 环 。 

1) 转换 首先 建立 结果 文档 的 根 。 在 此 过 程 中 把 源 文档 的 根 复制 到 结果 树 中 ， 并 且 使 它 成 
为 结果 文档 根 节点 的 一 个 孩子 。 源 文档 的 根 被 设置 成 当前 节点 (Current Node, CN), H% 
前 节点 列表 《Current Node List, CNL) 被 初始 化 为 只 包含 源 文档 的 根 节点 。 

2) CNL 保 存 源 文档 中 将 要 应 用 模板 的 节点 集 。 在 算法 中 ，CN 始 终 是 CNL 的 第 一 个 节点 。 
当 有 一 个 节点 N 被 放置 在 CNL 中 时 ， 它 的 副本 (我 们 记 作 N*) 就 会 被 放置 在 结果 文档 树 中 。 
Zin, 虽然 节 点 N" 可 能 被 删除 ， 或 者 被 一 个 模板 的 应 用 替换 ， 但 是 这 个 节点 起 了 标记 符 的 作 
用 ， 它 表明 接 下 来 结果 树 的 哪 部 分 会 发 生变 化 。 


# 17% XML 和 Web 数 据 447 


3) 程序 找到 CN 的 最 优 匹 配 模板 (best-matching template) 并 且 把 它 应 用 到 CN。 最 优 匹配 
模板 就 是 其 路 径 表 达 式 返回 的 源 文档 节点 集 最 小 并 且 当 前 节点 也 包含 在 这 个 节点 集中 的 模 
板 。 如 果 没 有 模板 的 路 径 表 达 式 返回 包含 当前 节点 的 集合 ， 那 么 就 会 调用 合适 的 默认 模板 。 

4) 应 用 模板 能 带 来 下 列 改变 : 

a. 结果 文档 树 中 的 CN 可 以 被 一 棵 子 树 替 换 。 举 个 例子 ， 假 设 CN 是 图 17-11 的 Students 
节点 。 那 么 图 17-12 的 样式 表 中 的 最 优 匹配 模板 是 


<xsl:template match="//Students"> 
<StudentList> 
<xsl:apply-templates/> 
</StudentList> 
</xsl:template> 


在 这 个 例子 中 ，CN8 被 替换 成 StudentList 元 素 节点 并 且 源 树 中 CN 的 每 个 元 素 文本 子 
节点 被 复制 到 结果 树 中 成 为 StudentList 的 孩子 。 这 个 转换 过 程 见 图 17-13a。 


5ga \ man 


Old CNL =<N,..... > go> 
F; 7 Kr n 
od on G. A 
Ne C : C 人 PRY Ca") im : 


Rai TE 5 a) 新 的 结果 树 b) 新 的 结果 树 


图 17-13 apply-templates 对 文档 树 的 作用 


b. 结果 文档 树 中 的 CN 可 以 删除 ， 它 的 父亲 可 以 得 到 其 他 的 孩子 。 举 个 例子 ， 
图 17-12 中 样式 表 的 默认 规则 


<xsl:template match="*|/"> 
<xsl:apply-templates/> 
</xsl:template> 


删除 了 CNF。 源 树 中 CN 的 元 素 文本 子 节点 被 复制 到 结果 树 中 成 为 CN" 父 节点 的 孩子 。 
这 个 转换 见 图 17-13b。 
在 这 两 种 情况 中 ， 如 果 CN 没 有 元 素 文本 子 节点 ， 那 么 CNL 会 变 短 成 为 模板 应 用 的 结果 。 


日 。、 如 果 有 这 样 的 几 个 模板 ， 就 使 用 其 他 的 规则 来 找到 其 中 最 优 的 模板 ， 参 见 [XSL 1999]。 
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否则 (如果 它 没有 这 样 的 子 节点 )，CNL 可 能 会 变 大 ， 因 为 CNL 中 的 CN 会 被 它 的 元 素 文本 子 
节点 的 列表 替换 。 这 些 孩 子 在 结 汪 树 中 和 在 CNL 中 放置 的 顺序 与 在 源 树 中 的 顺序 相同 。 特别 
的 ，CNL 的 第 一 个 节点 成 为 新 的 CN。 

一 般 来 说 ， apply- templates 指 令 有 一 个 select 属 性 : 

<xsl: apply- templates select = "some path expression"/> (17.3) 

事实 上 ，<xsl: apply-templates/>#£<xsl: apply-templates select=“node()”/> 的 简写 ， 
node(O) 是 一 个 XPath 函数 ， 它 返回 给 定 的 元 素 节点 的 元 素 文本 子 节点 集 。 例 如 ，<xsl: apply- 
templates select=“@*ltext()”/> 可 以 应 用 在 属性 (因为 通配符 “@*”) 和 文本 (因为 函数 
text()) 节点 上 ， 但 是 不 能 应 用 到 元 素 上 。 

一 般 来 说 ， 转 换 (17.3) 把 CN 替换 成 select 属 性 指定 的 节点 ，select 属 性 不 是 必需 的 ， 默 
认 情况 是 替换 成 CN 的 元 素 文本 子 节点 。 就 像 在 情况 a 和 b 中 解释 的 那样 ， 这 些 节点 也 被 复制 到 
结果 树 中 。 算 法 继续 进行 第 3 步 。 

5) 当 CNL 为 空 时 算法 终止 。 然 而 ， 一 般 它 可 能 不 会 终止 ， 所 以 样式 表 的 作者 要 确保 它 能 
够 终止 . 例如, 如果 apply-templates 的 select 属 性 中 的 路 径 表 达 式 是 “.”( 也 就 是 指向 当前 节点 )， 
那么 apply-templates 明 显 是 无 限 循环 。 一 个 普通 的 路 径 表达 式 可 能 指向 当前 节点 的 父亲 、 祖 先 
或 者 兄弟 ， 这 使 终止 分 析 变 得 很 困难 。 确 保 终止 的 一 个 简单 的 方法 让 所 有 select 属 性 中 的 路 径 
表达 式 只 能 搜索 当前 节点 的 子 树 。 那 么 ， 在 某 点 时 CNL 会 开始 收缩 并 最 终 为 空 。 

下 面 的 例子 阐明 了 XSLT 的 几 个 高 级 特性 。 假 设 我 们 打算 把 图 17-4 中 的 报告 的 属性 都 替换 
成 元 素 。 那 么 关于 John Doe 的 记录 被 重 写 为 : 


<Student> 
<StudId>111111111</StudId> 
<Name><First>John</First><Last>Doe</Last></Name> 
<Status>U2</Status> 
<CrsTaken> 
<CrsCode>CS308</CrsCode><Semester>F1997</Semester> 
</CrsTaken> 
<CrsTaken> 
<CrsCode>MAT123</CrsCode><Semester>F1997</Semester> 
</CrsTaken> 
</Student> 


此 外 ， 我 们 打算 写 一 个 样式 表 ， 使 它 不 必 知 道 源 文档 的 确切 属性 名 称 。 这 样 ， 如 果 以 后 
Grade 属 性 被 加 入 到 CrsTaken 元 素 中 ， 我 们 的 程序 仍 能 工作 ， 可 以 把 <CrsTaken...Grade="A'"/> 
转换 成 


<CrsTaken> ... <Grade>A</Grade></CrsTaken> : 

为 达到 这 个 目的 ， 样 式 表 必须 能 发 布 预 先 不 知道 名 字 的 元 素 ， 这 些 元 素 的 名 字 在 运行 时 
通过 源 文档 中 的 属性 计算 出 来 。 XSLT 的 两 个 新 特性 使 这 一 目标 变 成 了 可 能 。 

“clement 指令 使 样式 表 把 一 个 具有 给 定名 字 的 元 素 复制 到 结果 文档 中 。 例如 : 


<xsl:element name="name(current())">. 
~ I do not know where I am 
</xsl:element> 
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上 述 代码 会 在 执行 的 时 候 根据 当前 节点 的 不 同 复制 不 同 的 元 素 。 例 如 ， 如 果 在 执行 时 ， 当 前 
节点 是 一 个 名 字 为 foo 的 属性 ， 这 条 指令 会 把 下 面 的 元 素 复制 到 结果 中 : 


<foo> 
I do not know where I am 
</foo> 


在 这 个 样式 表 中 ，current0 是 一 个 运行 时 在 任何 特定 点 返回 当前 节点 的 XSLT 函 数 。 函 数 
name() 是 一 个 返回 节点 集 (被 传递 给 函数 作为 参数 ) 中 第 一 个 节点 名 字 的 XPath 函 数 。 在 本 
例 中 ， 在 执行 过 程 中 ， 参 数 始终 是 当前 节点 ， 所 以 函数 返回 当前 节点 的 名 字 。 

。copy 指 令 在 运行 过 程 中 的 特定 点 输出 当前 节点 。 不 要 把 这 个 指令 和 copy-of 指 令 混 淆 ， 

copy-of 指 令 输出 的 是 它 的 select 属 性 返回 的 节点 集 。 

此 外 ，copy-of 指 令 复 制 节点 及 其 所 有 从 属 ( 属 性、 孩子 元 素 等 )， 而 copy 指 令 不 返回 当前 
节点 的 属性 和 孩子 *。 这 个 特性 很 重要 ， 因 为 它 提供 了 对 输出 的 控制 程度 ， 特 别 是 使 样式 表 
可 以 截取 属性 节点 并 把 它们 作为 元 素 发 布 。 

copy 指 令 也 不 同 于 current0) 函 数 。 因 为 current() 函 数 不 是 一 个 指令 ， 它 不 能 复制 任何 内 容 
到 结果 文档 中 。 相 反 ， 作 为 一 个 函数 ， 它 返回 当前 节点 (包括 它 内 部 的 所 有 内 容 )， 并 且 返 回 
结果 可 以 被 XSLT 指 令 使 用 。 

我 们 问题 (找到 一 个 把 属性 转换 成 元 素 的 样式 表 ) 的 一 个 可 行 的 解决 方法 如 图 17-14 所 示 。 
这 个 样式 表 有 两 个 模板 。 源 文档 的 处 理 和 平常 一 样 从 根 节 点 开始 。 因 为 没有 显 式 的 模板 匹配 
根 ， 所 以 调用 合适 的 默认 模板 。 像 前 面 看 到 的 那样 ， 默 认 模 板 (17.2) 把 CNL 上 的 CN 替换 成 
它 的 元 素 子 节点 列表 并 且 让 处 理 器 对 列表 应 用 匹配 的 模板 。 在 图 17-11 的 文档 中 ， 根 节点 唯一 
的 孩子 是 Students 元 素 ， 所 以 处 理 器 试图 找到 一 个 与 之 相 匹 配 的 模板 。 


<?xml version="1.0" ?> \ 
<xsl:istylesheet xmlns:xsl="http: //www.w3.org/1999/XSL/Transforn" 
xsl: version="1.0"> 
<xsl:template match="node()"> 
<xsl:copy> 
<xsl:apply-templates select="@*"/> 
<xsl:apply-templates/> 
</xsl:copy> 


</xsl:template> 
<xsl:template match="@%"> 
<xsl:element name="name (current ())"> 
<xsl:value-of select="."/> 


</xsl:element> 
</xsl:template> 
</xsl:stylesheet> 





图 17-14 把 属性 转换 为 元 素 的 XSLT 样 式 表 


我 们 的 样式 表 中 只 有 第 一 个 模板 匹配 : XPath 函数 node(0 匹 配 文档 树 中 的 除了 根 和 属性 节 
点 以 外 的 所 有 节点 。( 第 二 个 模板 选择 了 匹配 路 径 表达 式 @* 的 文档 节点 ，@* 匹 配 当 前 节点 的 


合 ” 对 于 元 素 节点 ， 节 点 名 是 标记 名 。 对 于 属性 节点 ， 节 点 名 是 属性 名 。 
O SR, 如果 当前 节点 是 文本 节点 或 属性 ， 就 不 需要 晃 过 什么 ， 直 接 把 整个 节点 复制 。 
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每 个 属性 。) 

第 一 个 模板 把 当前 节点 N 复 制 到 结果 中 。 回 想 一 下 ，copy 指 令 去 掉 了 孩子 和 属性 ， 所 以 
有 N 被 复制 。 对 N 的 属性 和 元 素 文本 子 节点 的 处 理由 copy 指 令 中 的 两 条 apply-templates 指 令 
现 。 

第 一 个 apply-templates 指 令 把 N (当前 节点 ) 的 属性 加 入 到 CNL 的 开头 。CNL 的 第 一 个 节 
点 成 为 新 的 当前 节点 CN。 假 设 N 有 属性 ， 只 有 第 二 个 模板 匹配 CN， 所 以 使 用 此 模板 。 它 输出 
与 当前 属性 具有 相同 名 字 的 元 素 (因为 模板 只 对 属性 应 用 ， 所 以 current0 一 定 返回 属性 节点 )， 
并 且 把 当前 属性 的 值 作为 这 个 元 素 的 内 容 。( 例 如 ，Attr=“something” 被 转换 成 
<Attr>something</Attr> ) 

我 们 对 copy 指 令 中 的 第 二 个 apply-templates 指 令 已 经 很 熟悉 了 。 它 对 当前 节点 的 每 个 元 素 
文本 子 节点 应 用 模板 ， 但 不 对 属性 节点 应 用 。 和 以 前 一 样 ， 只 有 第 一 个 模板 匹配 这 些 节点 ， 
所 以 它们 被 复制 ， 它 们 的 属性 被 转换 成 元 素 ， 然 后 重复 过 程 。 

3. XSLT 的 局 限 , 

XSLT 具 有 一 些 使 其 成 为 数据 库 查询 语言 的 特性 : 它 能 从 一 个 文档 中 提取 出 节点 集合 ， 重 
新 整理 它们 ， 通 过 递归 遍历 文档 树 来 应 用 转换 。 然 而 ，XSLT 在 一 些 重要 方面 仍 有 欠缺 ， 这 使 
它 在 作为 查询 语言 使 用 时 有 一 定局 限 。 l 

最 重要 的 问题 与 文档 间或 同一 文档 各 部 分 间 的 联结 有 关 ， 这 和 关系 数据 库 中 的 联结 操作 
类 似 。 作 为 一 个 简单 的 例子 ， 考 虑 利用 图 17-4 中 的 记录 产生 一 个 学 生 记录 列表 ， 在 列表 中 给 
学 生 选 的 每 门 课程 附 上 课程 名 。 为 此 ， 我 们 需要 关联 具有 相同 课程 号 的 CrsTaken 元 素 和 
Course 元 素 。 

事实 上 ， 要 用 XSLT 表 达 这 样 的 联结 查询 是 很 麻烦 的 。 一 种 方法 是 下 降 到 Student 元 素 ， 对 
每 个 CrsTaken 使 用 带 有 select 属 性 的 apply-templates ，select 中 的 路 径 指向 对 应 的 Course 元 素 。 
尽管 不 自然 ， 但 这 种 方法 是 可 行 的 ， 只 是 需要 使 用 XSLT 变 量 (在 本 节 中 没有 讨论 这 种 机 制 )。 
另 一 种 方法 是 使 用 for-each 循 环 侣 套 ， 并 用 XSLT 变 量 保存 文档 节点 集 。 这 种 方法 与 在 伐 入 式 
SQL 中 把 联结 操作 显 式 地 编码 成 修 套 循环 来 查询 数据 库 的 方法 相似 。 

幸运 的 是 ，XSLT 不 是 XML 查 询 的 最 新 成 果 ， 还 有 一 些 其 他 的 XML 查 询 语言 已 经 开发 出 
来 了 。 


17.4.3 XQuery: XML 的 一 个 功能 完善 的 查询 语言 


XPath 和 XSLT 提 供 了 对 XML 文 档 的 一 定 的 查询 能 力 。 然 而 ， 我 们 已 经 发 现 XPath 被 设计 成 
轻 量 级 的 ， 所 以 只 能 表达 简单 的 查询 。XSLT 有 更 强 的 表达 能 力 ， 但 它 不 是 作为 一 种 查询 语言 
来 设计 的 ， 所 以 ， 它 在 处 理 复杂 的 查询 时 有 些 困 难 。 

在 众多 的 为 查询 XML 而 设计 的 语言 中 ， 应 该 关注 一 下 XQL 和 XML-QL。XQLIRobie et 
al.1998] 是 XPath 的 一 个 扩展 ，XML-QLIDeutsch et al.1998,Florescu et al.1999] 是 一 种 SQL 式 的 
查询 语言 ， 它 同时 借鉴 了 其 他 一 些 语言 的 思想 ， 例 如 OQL (参见 第 16 章 ) 和 Lorel[Abiteboul 
et al.1997]。 最 近 ，XQL 和 XML-QL 的 优秀 特性 被 组 合成 为 另 一 种 叫做 XQuery 的 语言 ， 它 是 目 
前 W3C 对 XML 的 正式 的 查询 语言 [XQuery 2001] 的 设计 基础 。 像 XSLT 一 样 ，XQuery 使 用 了 
XPath 作为 它 路 径 表 达 式 的 语法 。 然 而 ，XQuery 在 查询 的 时 候 通 常 比 XSLT 更 加 简洁 和 透明 。 


`o 


将 
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本 节 将 介绍 XQuery 的 主要 特性 。 

1. 选择 和 连接 

和 XSLT 不 同 ，XQuery 不 使 用 XML 元 长 的 语法 ， 因 为 没有 理由 让 任何 查询 语言 都 这 样 做 9 。 
相反 ，XQuery 语 句 跟 SQL 有 一 些 相似 : 

FOR 变量 声明 ° 

WHERE 条 件 

RETURN 结果 

FOR 语句 的 作用 与 SQL 中 的 FROM 语句 作用 相同 ，WHERE 话 句 也 同 SQL 中 的 WHERE 语 
名 功能 一 致 。RETURN 语 句 类似 于 SELECT: 在 SQL 中 ， 它 定义 结果 关系 的 模板 ; 在 XQuery 
中 ， 它 指定 结果 文档 的 模板 。 

更 深入 地 说 ，XQuery 受 ODMG 数 据 库 (参见 第 16 章 ) 的 面向 对 象 查 询 语言 0QL 影 响 很 深 。 
这 种 联系 可 以 从 例子 中 看 出 来 。 我 们 从 对 图 17-15 的 文档 的 简单 查询 开始 ， 此 文档 在 URL 
http://xyz.edu/transcripts.xml 中 。 ` 

第 一 个 查询 查找 所 有 选修 过 课程 MAT123 的 学 生 。 


FOR $t IN document ("http://xyz.edu/transcripts.xml" )//Transcript 
WHERE $t/CrsTaken/@CrsCode = "MAT123" 
RETURN $t/Student 


FOR 语句 声明 了 一 个 变量 $t 和 它 的 范围 一 一 一 个 文档 节点 集合 。 这 个 集合 由 XPath 表达 式 
“WTranscript” 指 定 ， 这 个 XPath 表达 式 将 应 用 在 用 邱 数 document(0 得 到 的 文档 上 。documentO 
函数 借鉴 自 XSLT， 它 返回 URL 指 定 的 文档 的 根 。 所 以 $t 的 范围 是 文档 中 的 所 有 Transcript 节 点 。 
XQuery 依 赖 于 用 变量 扩展 了 的 XPath 表 达 式 来 导航 文档 树 ， 所 以 ，$t/CrsTaken/@CrsCode 和 
$UStudent 是 扩展 后 的 XPath 表达 式 。 当 $t 绑 定 在 文档 树 的 一 个 Transcript 节 点 时 ， 第 一 个 表达 
式 返 回 那些 对 应 于 这 个 节点 的 元 素 子 节点 CrsTaken 的 CrsCode 属 性 的 节点 。 第 二 个 表达 式 返 回 
这 个 节点 的 元 素 子 节 点 Student。 

WHERE 条 件 选 出 了 Transcript 节 点 的 一 个 子 集 ， 这 个 集合 中 每 个 节点 都 有 一 个 CrsCode 属 
性 值 为 MAT123 的 CrsTaken 元 素 作为 孩子 节点 。 变 量 $t 被 轮流 绑 定 到 每 个 Transcript 节 点 上 ， 
RETURN 语 名 分 别 执行 $t 的 每 个 绑 定 。 每 次 执行 输出 结果 文档 的 一 部 分 ， 在 本 例 中 是 包含 在 4t 
当前 值 的 Transcript 节 点 中 的 Student 元 素 。 下 面 是 本 例 的 输出 : 


<Student StudId="111111111" Name="John Doe"/> 
<Student StudId="123454321" Name="Joe Blow'"/> 


这 里 ， 我 们 的 问题 是 查询 没有 产生 结构 良好 的 XML 文档 。 它 产生 了 一 个 Student 元 素 的 列 
表 ， 但 是 没有 把 它们 包含 在 一 个 父 元 素 中 。 把 上 面 的 查询 嵌入 一 对 标记 中 就 可 以 轻松 地 解决 
这 个 问题 。 

<StudentList> 

( 


FOR $t IN document ("http://xyz.edu/transcripts.xml") 
//Transcript 


O 至 少 ,不 是 给 人 类 使 用 的 。 然 而 ，XQuery 中 基于 XML 的 语法 正在 发 展 中 。 首 先 ， 它 可 以 简化 为 XQuery 构 
建 解析 器 的 工作 。 
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WHERE $t/CrsTaken/@CrsCode = "MAT123" 
RETURN $t/Student 


) 
.</StudentList> 


结果 是 FOR 语 句 逐 个 输出 Student 元 素 ， 并 且 把 它们 作为 StudentList 节 点 的 孩子 。 

在 下 面 的 例 也 中 ， 当 最 顶层 的 标记 对 的 作用 仅仅 是 给 查询 结果 提供 一 个 根 元 素 时 ， 就 像 
上 例 中 的 StudentList， 我 们 就 会 省 略 它 。 

下 面 的 例子 说 明了 XQuery 的 结构 重组 能 力 。 图 17-15 的 文档 Transcripts 将 学 生 选 过 的 课程 
放 在 相应 的 学 生 周 围 。 然 而 ， 阅 读 这 个 文档 的 读者 可 能 想 为 每 门 课程 重新 构建 班级 列表 。 换 
句 话说， 对 某 个 学 期 的 开设 的 每 门 课程 , .他 可 能 想得到 选修 这 门 课 的 学 生 列 表 。 在 XQuery 中 ， 
这 可 以 直接 用 图 17-16 的 transcripts.xml 来 得 到 。 在 此 查询 中 ， 变 量 $c 的 范围 是 transcripts.xml 文 
档 中 所 有 不 同 的 CrsTaken 节 点 集合 。 对 每 个 这 样 的 节点 ， 将 会 像 RETURN 语 名 中 描述 的 那样 
建立 结果 文档 的 一 个 片段 。 


<?xml version="1.0" ?> 
<Transcripts> 
<Transcript> 
<Student StudId="111111111" Name="John Doe"/> 
<CrsTaken CrsCode="CS308" Semester="F1997" Grade="B"/> 
<CrsTaken CrsCode="MAT123" Semester="F1997" Grade="B"/> 
<CrsTaken CrsCode="EE101" Semester"F1997" Grade="A"/> 
<CrsTaken CrsCode="CS305" Semester="F1995" Grade="A"/> 
</Transcript> 
<Transcript> 
<Student StudId="987654321" Name="Bart Simpson"/> 
<CrsTaken CrsCode="CS305" Semester="F1995" Grade="C"/> 
<CrsTaken CrsCode="CS308" Semester="F1994" Grade="B"/> 


</Transcript> 
<Transcript> 
<Student StudId="123454321" Name="Joe Blow"/> 


<CrsTaken CrsCode="CS315" Semester="S1997" Grade="A"/> 
<CrsTaken CrsCode="CS305" Semester="S1996" Grade="A"/> 
<CrsTaken CrsCode="MAT123" Semester="S1996" Grade="C"/> 

</Transcript> 

<Transcript> 
<Student Studid="023456789" Name="Homer Simpson"/> 
<CrsTaken CrsCode="EE101" Semester="F1995" Grade="B"/> 
<CrsTaken CrsCode="CS305" Semester="S1996" Grade="A"/> 

</Transcript> 

_ </Transcripts> 





图 17-15 http://xyz.edu/transcripts.xml 上 的 成 绩 单 


图 17-16 中 的 查询 几乎 是 正确 的 ， 但 是 它 有 一 个 缺点 ， 这 个 问题 我 们 在 讨论 了 这 个 查询 中 
展示 的 新 特性 后 再 作 解 释 。 

首先 注意 ， 这 个 查询 是 嵌 套 的 。 然 而 ， 有 趣 的 是 碟 套 出 现在 RETURN 语 句 中 ， 它 对 应 的 
是 SQL 中 的 SELECT 语句 。 回 想 一 下 ，SQL 在 SELECT 语句 中 禁止 嵌 套 查询 (RRETHE 
回 多 于 一 个 的 元 组 ) ， 因 为 嵌 套 查询 在 关系 模型 中 没有 意义 。 的 确 ， 一 个 供 套 查询 通常 返回 一 
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组 元 组 ， 然 而 SQL 中 SELECT 语句 的 目标 列表 是 一 个 元 组 的 模板 。 与 在 SQL 中 相反 ，RETURN 
语句 中 的 幅 套 查询 对 XML 查 询 语 言 极 有 意义 ， 因 为 这 里 的 目的 是 构造 一 个 具有 任意 复杂 隆 套 
结构 的 文档 。 在 本 例 中 ， 余 套 查询 的 目的 是 把 学 生 列 表 和 借入 到 班级 花 名 册 中 。 我 们 已 经 见 过 
在 一 个 查询 的 目标 列表 中 使 用 嵌 套 查询 的 情况 , 这 在 面向 对 象 查询 语言 QQL ( 见 查询 (16.11 ) ) 
中 是 允许 的 。 在 那里 使 用 锯 套 的 原因 和 在 XQuery 中 使 用 嵌 套 的 原因 是 相同 的 。 


FOR $c IN distinct (document ("http://xyz.edu/transcripts.xml") 
//CrsTaken) 
RETURN <ClassRoster CrsCode=$c/@CrsCode Semester=$c/@Semester> 


FOR $t IN document ("http://xyz.edu/transcripts.xml") 
//Transcript 
WHERE $t/CrsTaken/@CrsCode = $c/e@CrsCode 
AND $t/CrsTaken/@Semester = $c/@Semester 
RETURN 
$t/Student 
SORTBY ($t/Student /@eStudId) 
) 
</ClassRoster> 
SORTBY ($c/@CrsCode) 





图 17-16 从 transcripts 构 造 班级 花 名 册 : 第 一 次 尝试 


.我 们 再 仔细 看 看 图 17-16 中 查询 的 RETURN 语 句 ， 它 对 于 变量 $c 的 每 个 值 分 别 执行 。 首 先 ， 
它 构造 ClassRoster 元 素 并 为 CrsCode 和 Semester 属 性 设置 适当 的 值 。 然 后 调用 谍 套 子 查询 来 构 
造 这 个 班级 〈 即 对 给 定 学 期 中 的 给 定 课 程 ) 的 学 生 的 有 序列 表 。 其 中 ，$t 涵 盖 Transcript 元 素 ， 
然后 WHERE 语句 选 出 的 那些 特定 的 Transcript 元 素 ， 这 些 Transcript 中 有 一 个 CrsTaken 元 素 与 
$c 中 指定 的 学 期 和 课程 相 匹配 。 输 出 由 如 下 元 素 组 成 : 

<ClassRoster CrsCode="CS305" Semester="F1995"> 
<Student StudId="111111111" Name="John Doe"/> 


<Student StudId="987654321" Name="Bart Simpson"/> 
</ClassRoster> 


在 每 个 花 名 册 中 ， 这 些 元 素 已 经 根据 CrsCode 属 性 排 好 序 了 。 
到 现在 为 止 ， 一 切 都 很 好 ， 只 是 John Doe 和 Bart Simpson 在 1995 年 秋天 的 CS305 中 得 到 了 
不 同 的 分 数 ， 所 以 FOR 语句 为 那个 班级 把 $gc 绑 定 在 用 一 个 课程 的 两 个 不 同 的 CrsTaken 元 素 上 。 


<CrsTaken CrsCode="CS305" Semester="F1995" Grade="A"/> 
<CrsTaken CrsCode="CS305" Semester="F1995" Grade="C"/> 


这 意味 着 上 面 的 ClassRoster 元 素 将 输出 两 次 。 一 般 来 说 ， 每 个 花 名 册 对 相应 的 班级 中 每 
个 不 同 的 分 数 输 出 一 次 。 解 决 这 个 问题 的 方法 是 建立 一 个 包含 所 有 班级 列表 的 新 文档 ， 然 后 
把 $c 绑 定 在 列表 的 元 素 上 。 这 个 任务 可 以 很 容易 完成 ， 方 法 是 从 Transcripts 文 档 中 选 出 所 有 的 
CrsTaken 元 素 并 去 掉 Grade 属 性 。 : 

我 们 等 会 再 来 考虑 这 个 想法 ， 现 在 我 们 通过 假设 已 经 存在 图 17-17 所 示 的 文档 来 避 开 这 个 
问题 ， 此 文档 在 URL http:/xyz.edu/classes.xml。 下 面 的 查询 是 将 图 17-16 那 个 有 缺点 的 查询 稍 
加 改动 而 形成 的 ， 目 的 是 说 明 XQuery 中 的 联结 操作 
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FOR $c IN document ("http://xyz.edu/classes.xml")//Class 


RETURN 
<ClassRoster CrsCode=$c/@CrsCode Semester=$c/@Semester> 
$c/CrsName 
$c/Instructor 
¢ 
FOR $t IN document ("http: //xyz.edu/transcripts.xml") 
//Transcript 
WHERE $t/CrsTaken/@CrsCode = $c/@CrsCode 
AND $t/CrsTaken/@Semester = $c/@Semester 
RETURN 
$t/Student 
SORTBY ($t/Student/@StudId) 
) 
</ClassRoster> 
SORTBY ($c/@CrsCode) 


<?xml version="1.0" ?> 
<Classes> 
<Class CrsCode="CS308" Semester="F1997"> 
<CrsName>Market Analysis</CrsName> 
<Instructor>Adrian Jones</Instructor> 
</Class> 
<Class CrsCode="EE101" Semester="F1995"> 
<CrsName>Electronic Circuits</CrsName> 
<Instructor>David Jones</Instructor> 
</Class> 
<Class CrsCode="CS305" Semester="F1995"> 
<CrsName>Database Systems</CrsName> 


<Instructor>Mary Doe</Instructor> 
</Class> 
<Class CrsCode="CS315" Semester="$1997"> 


<CrsName>Transaction Processing</CrsName> 
<Instructor>John Smyth</Instructor> 

</Class> 

<Class CrsCode="MAT123" Semester="F1997"> 
<CrsName>Algebra</CrsName> 
<Instructor>Ann White</Instructor> 

</Class> 

</Classes> 





图 17-17 http://xyz.edu/classes.xml 上 的 班级 


新 查询 中 的 改变 是 变量 $c 的 取 值 范围 变 为 图 17-17 的 文档 中 所 有 Class 节 点 的 集合 。 因 为 在 
这 里 班级 不 会 出 现 多 次 ， 所 以 我 们 不 再 有 输出 同一 个 花 名 册 的 多 个 实例 的 问题 (我 们 甚至 不 
需要 应 用 distinct() 函 数 )。 新 查询 的 结果 为 每 个 花 名 册 增 加 了 课程 名 ($c/CrsName) 和 教师 
($c/Instructor) 作为 子 元 素 。 这 样 ， 这 个 查询 在 图 17-15 文 档 的 Transcript 元 素 和 图 17-17 文 档 
的 Class 元 素 之 间 在 CrsCode 和 Semester 属 性 上 做 了 等 值 联结 。 像 17.4.2 节 结尾 提 到 的 那样 ， 
XSET 难 以 实现 这 种 格式 转换 。 

注意 ， 在 上 面 的 查询 中 ， 即 使 有 些 班级 没有 学 生 ， 对 应 的 ClassRoster 元 素 仍然 会 在 结果 
中 出 现 ， 只 是 内 容 为 空 。 这 与 关系 数据 库 中 的 联结 操作 不 同 ， 在 关系 数据 库 中 ，CLASS 关 系 
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中 的 一 个 元 组 如 果 在 TRANSCRIPT 关 系 中 没有 匹配 元 组 ， 那 么 不 会 考虑 在 CrsCode 和 Semester 
属性 上 做 等 值 联结 。 上 面 XQuery 例 子 中 的 联结 在 关系 数据 库 中 相当 于 外 连接 (在 第 6 章 的 练 
习 6.9 中 定义 )。 不 过 ， 在 最 外 层 的 FOR 语句 中 加 入 一 个 WHERE 语句 以 使 其 实现 “真正 的 ” 联 
结 是 很 简单 的 : 
FOR $c IN document ("http://xyz.edu/classes.xml")//Class 
WHERE document (“http://xyz.edu/transcripts.xml") 
//CrsTaken[@CrsCode = $c/@CrsCode 
and @Semester = $c/@Semester] 
RETURN 
<ClassRoster CrsCode=$c/@CrsCode Semester=$c/@Semester> 
$c/CrsName 
$c/Instructor 
( 
FOR $t IN document ("http://xyz.edu/transcripts.xml") 
//Transcript 
WHERE $t/CrsTaken/@CrsCode = $c/e@CrsCode 
AND $t/CrsTaken/@Semester = $c/@Semester 
RETURN 
$t/Student 
SORTBY ($t/Student/@StudId) 
) 
</ClassRoster> 
SORTBY ($c/@CrsCode) 


新 WHERE 语句 的 目的 是 测试 http:/xyz.edu/transcripts.xml 处 的 文档 是 否 有 与 用 于 变量 $c 当 
前 值 的 CrsCode 和 Semester 属 性 匹配 的 CrsTaken 元 素 。 这 个 测试 由 第 一 个 WHERE 语句 的 路 径 
表达 式 “/WCrsTaken[…]” 实 现 。 只 有 当 这 样 的 CrsTaken 元 素 存 在 时 ， 对 应 的 ClassRoster 元 素 
才 会 输出 。 所 以 ， 没 有 学 生 的 班级 花 名 册 不 会 在 结果 中 出 现 。 

2. XQuery 的 语义 

BAA Auk, 我 们 已 经 讨论 了 不 同 的 例子 ， 却 还 没有 解释 实际 查询 计算 机 制 是 如 何 工作 
的 。 我 们 现在 来 解释 这 些 问题 。 

FOR 语句 有 如 下 功能 : 

“指明 查询 中 使 用 的 文档 。 

。 声 明 变量 。 

* 把 每 个 变量 绑 定 到 由 XQuery 表 达 式 指明 的 文档 节点 的 有 序 集合 上 。 通 常 ， 这 个 XQuery 

表达 式 是 一 个 XPath 表 达 式 ， 但 是 ， 正 如 我 们 即将 看 到 的 ， 它 也 可 以 是 一 个 能 够 返回 一 
个 节点 列表 的 查询 或 者 函数 。 

FOR 语句 中 产生 的 绑 定 被 翻译 成 一 个 有 序 的 元 组 列表 ， 每 个 元 组 含有 FOR 语句 中 提 到 的 
每 个 变量 的 具体 绑 定 。 举 个 例子 ， 如 果 FOR 语 名 声明 变量 $a 和 $b， 并 且 分 别 把 它们 绑 定 到 文 
档 节点 {vy,w} 和 {x,y,z} 上 ， 那 么 就 会 产生 有 序 元 组 列表 {yx}，{v,y}，{y,z}，{w,x}，{w,y}， 
{wxz}。 每 个 元 组 (比如 {wx}) 提供 一 个 具体 的 绑 定 ($a/w，$b/x) 给 我 们 的 变量 。 

下 一 步 ， 由 WHERE 条 件 对 绑 定 的 元 组 进行 得 选 。 因 此 ， 如 果 条 件 是 $a/CrsTakeny/ 
@CrsCode = $b/Class/@CrsCode ， 并 且 相 应 的 文档 节点 w 和 x 满 足 w/CrsTaken/@CrsCode = 
x/Class/@CrsCode， 则 $a 和 $b 的 绑 定 元 组 {w,x*} 就 会 被 保留 ， 否 则 ， 它 会 被 丢弃 。WHERE 语 
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名 的 作用 是 选 出 原来 元 组 列表 的 一 个 有 序 子 列表 。 

最 后 ， 对 每 一 个 保留 的 元 组 绑 定 ，RETURN 表 达 式 都 会 实例 化 一 次 。 结 果 是 创建 输出 文 
档 的 一 部 分 。 重 复 这 个 过 程 ， 直 到 所 有 合格 的 元 组 绑 定 被 处 理 完 为 止 。 

3. 过 滤 

改正 图 17-16 的 查询 来 建立 班级 花 名 册 的 最 简单 方法 是 使 用 XQuery 的 filter0 函 数 。 这 个 孙 
数 有 两 个 参数 ， 每 个 参数 都 是 一 个 文档 节点 集合 。 第 一 个 参数 中 的 每 个 节点 代表 一 个 文档 片 
段 (一 个 以 这 个 节点 为 根 的 子 树 ) ， 第 二 个 参数 中 每 个 节点 代表 它 本 身 (也 就 是 不 包括 它 的 孩 
子 节点 )。 

filter() 通 过 删除 所 有 在 第 二 个 参数 中 没有 出 现 的 节点 来 裁剪 作为 第 一 个 参数 的 文档 片段 。 
这 些 文档 树 中 剩余 的 节点 被 互相 连接 起 来 以 保留 原来 的 祖 孙 关系 ， 并 且 和 返回 文档 片段 的 结果 
集 。 例 如 ， 下 面 的 fter0 操 作 应 用 在 图 17-17 的 文档 上 9。 


filter(//Class, //Class|//Class/CrsName) 


会 产生 下 面 的 文档 片段 : 


<Class><CrsName>Market Analysis</CrsName></Class> 
<Class><CrsName>Electronic Circuits</CrsName></Class> 
<Class><CrsName>Database Systems</CrsName></Class> 
<Class><CrsName>Transaction Processing</CrsName></Class> 
<Class><CrsName>Algebra</CrsName></Class> 


注意 ， 尽 管 节 点 集 “//Class” 包 含 在 fter() 表 达 式 的 第 二 个 参数 中 ,但 是 它 的 属性 节点 没 
有 显 式 出 现 ， 所 以 这 些 属性 不 会 在 输出 中 出 现 。 同 样 ， 因 为 元 素 子 节 点 Instructor 没 有 显 式 出 
现 ， 所 以 它 也 没有 出 现在 结果 中 。 

回想 一 下 图 17-16 中 导致 查询 问题 的 原因 。 由 于 Grade 属性 ， 变 量 $c 可 能 会 被 绑 定 到 两 个 
不 同 的 CrsTaken 元 素 上 ， 但 是 这 两 个 元 素 的 CrsCode 和 Semester 却 有 相同 的 值 。filter(0) 国 数 能 
排除 Grade 属性 ， 这 样 就 去 掉 了 $c 的 无 关 绑 定 : 


LET $trs := document ("http://xyz.edu/transcripts.xml")//Transcript 
LET $ct := $trs/CrsTaken 
FOR $c IN distinct(filter($ct, $ct | $ct/@CrsCode | $ct/@Semester)) 
RETURN 
<ClassRoster CrsCode=$c/@CrsCode Semester=$c/@Semester> 
( a 
FOR $t IN $trs 
WHERE $t/CrsTaken/@CrsCode = $c/@CrsCode 
AND $t/CrsTaken/@Semester = $c/@Semester 
RETURN 
$t/Student 
SORTBY ($t/Student/@StudId) 
) 
</ClassRoster> 
SORTBY ($c/@CrsCode) 


上 面 的 查询 和 图 17-16 中 查询 的 本 质 不 同 是 使 用 了 filterO) 函 数 和 LET 语 名 。LET 语 句 只 是 
把 所 有 Transcript 节 点 集 赋值 给 了 变量 $trs ， 把 Transcript 节 点 的 子 节 点 CrsTaken 集 合 赋值 给 了 


O “|” 在 路 径 表 达 式 中 表示 表达 式 的 并 。 
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变量 gct。 这 么 做 减少 了 对 $c 进 行 绑 定 的 语句 长 度 ， 并 且 简 化 了 第 二 个 FOR 语句 。 换 名 话说， 
如 果 我 们 把 出 现 $trs 和 $ct 的 地 方 赫 换 成 它们 的 值 ， 那 么 我 们 可 以 去 掉 LET 语 句 。 

然而 ，filter 表 达 式 

filter($ct, $ct | $ct/@CrsCode | $ct/@Semester) 
并 不 是 一 个 语法 上 的 优点 。 这 里 的 第 一 个 参数 是 所 有 的 CrsTaken 元 素 集 (包括 它们 的 孩子 )， 
第 二 个 参数 的 三 个 选择 部 分 对 第 一 个 参数 的 集合 进行 了 剪除 ， 只 保留 了 元 素 节点 本 身 和 它 的 
两 个 属性 ， 去 掉 了 Grade 属性 (CrsTaken 没 有 元 素 子 节点 ， 所 以 没有 其 他 要 剪除 的 )。 结 果 是 
一 个 元 素 列 表 ， 如 : 


<CrsTaken CrsCode="MAT123" Semester="F1997"> 
<CrsTaken CrsCode="CS8305" Semester="F1995"> 


所 以 ， 剪 除 之 后 ， 元 素 


<CrsTaken CrsCode="CS305" Semester="F1995" Grade="A"/> 
<CrsTaken CrsCode="CS305" Semester="F1995" Grade="C"/> 


变 得 等 同 了 ， 所 以 在 调用 了 distinct() 函 数 后 只 有 一 个 能 保留 下 来 。 这 正 是 我 们 在 图 17-16 的 查 
询 中 想得到 的 。 

4. 用 户 定义 的 函数 

XQuery 提 供 了 大 量 的 内 置 函数 ， 包 括 所 有 XPath 中 可 用 的 核心 函数 。 它 也 提供 了 其 他 一 
些 有 用 的 函数 ， 如 distinctQ 和 document()， 以 及 其 他 我 们 下 面 将 会 看 到 的 函数 。 

更 吸引 人 的 是 ，XQuery 中 一 个 的 查询 中 可 以 定义 许多 函数 ， 这 些 函 数 可 以 在 FOR- 
WHERE-RETURN 主 查询 中 被 调用 。 函 数 可 以 递归 地 调用 它们 自身 ; 它们 可 以 把 单独 的 节点 
或 节点 集 作为 参数 ; 它们 可 以 返回 基本 类 型 、 文 档 节点 或 者 这 些 类 型 的 集合 。 函 数 体 是 一 个 
通用 的 XQuery 表 达 式 (甚至 查询 也 可 以 当成 是 表达 式 )。 一 个 表达 式 可 以 处 理 整数 、 元 素 、 
元 素 列 表 等 等 、 然 后 函数 返回 它 的 结果 。 | 

下 面 是 一 个 函数 的 例子 ， 这 个 函数 计算 以 $e 为 根 的 文档 片段 中 子孙 元 素 和 文本 节点 的 
个 数 : 


FUNCTION countNodes (AnyElement $e) RETURNS integer { 
RETURN 
IF empty($e/*) THEN 0 
ELSE sum(countNodes($e/*)) + count ($e/*) 
} 


这 个 函数 定义 阐明 了 以 下 一 些 特性 : ”| 
* 声 明 AnyElement $e 说 明 函 数 的 参数 必须 是 一 个 元 素 。 它 不 能 是 一 个 属性 或 文本 节点 ; 
也 不 能 是 整数 。 函 数 会 返回 一 个 整数 。 我 们 在 后 面 会 解释 这 些 类 型 的 来 源 。 

XQuery 函 数 体 是 一 个 XQuery 表 达 式 ， 它 将 会 计算 出 一 个 值 ( 整数、 字符 串 、 文 档 节点 、 
节点 列表 等 等 ) 表 。 这 个 表达 式 的 值 被 返回 。 下 面 会 解释 XQuery 表 达 式 。 
“IF-THEN-ELSE 语 句 是 一 个 XQuery 条 件 表达 式 。 在 IF 和 THEN 之 间 必 须 是 一 个 布尔 表达 
式 一 一 在 本 例 中 是 empty($e/x)， 它 用 内 置 函 数 empty0) 检 查 路 径 表达 式 $e/* 是 否 返 回 文档 
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节点 的 一 个 空 集 。 。 

THEN 和 ELSE 部 分 必须 是 XQuery 表 达 式 。 这 里 我 们 没有 定义 XQuery 表 达 式 的 完整 语 
法 9。 一 般 它 们 会 是 路 径 表 达 式 (返回 一 个 文档 节点 集 )、 函 数 调用 (返回 一 个 基本 类 
型 ， 比 如 integer 或 string， 一 个 文档 节点 ,或 者 是 调用 用 户 定义 函数 情况 下 一 个 节点 集 )、 
算术 表达 式 、IF-THEN-ELSE 条 件 表达 式 或 完整 的 查询 (返回 一 个 文档 或 者 返回 文档 片 
段 的 列表 )。 

在 本 例 中 ，THEN 表 达 式 是 一 个 常数 ，ELSE 表 达 式 是 一 个 调用 聚合 函数 sum() 和 count() 
的 算术 表达 式 。 利 用 递归 调用 countNodes() (下 面 会 解释 ) 得 到 的 数字 值 ，sum0) 函 数 将 
对 它们 进行 求 和 。count0) 函 数 对 路 径 表 达 式 $e/* 返 回 的 节点 进行 统计 。 
。 递 归 调 用 countNodesO 很 有 趣 。 注 意 ， 在 签名 中 ， 这 个 函数 的 参数 是 一 个 元 素 。 可 是 ， 似 
乎 与 这 里 的 声明 矛盾 ， 这 个 调用 应 用 到 会 返回 文档 节点 集 的 路 径 表 达 式 。 这 不 是 错误 。 
XQuery 中 一 般 规 定 ， 在 这 种 情况 下 ， 函 数 会 对 集合 中 每 个 元 素 应 用 一 次 ， 返 回 每 次 

应 用 的 结果 组 成 的 集合 。 (17.4) 


所 以 ，countNodes() 被 应 用 到 它 的 参数 集中 的 每 个 文档 节点 ， 并 且 返 回 一 组 整数 ， 这 组 整 
数 由 内 置 察 合 函 数 sum0) 求 和 并 传递 给 算术 表达 式 。 

在 下 个 例子 中 ， 我 们 再 看 一 看 图 17-16 中 “几乎 正确 ”的 查询 。 回 想 一 下 ， 其 中 间 题 是 如 
果 一 个 班级 中 至 少 有 两 个 学 生得 到 了 不 同 的 分 数 ， 那 么 结果 中 班级 花 名 册 就 会 出 现 多 次 。 我 
们 提出 的 一 个 解决 方案 是 把 Transcripts 与 图 17-17 中 的 文档 做 联结 。 用 XQuery 函 数 可 以 建立 一 
个 与 图 17-17 相 似 的 中 间 文 档 ， 并 且 在 查询 中 把 它 和 Transcripts 做 联结 ， 这 样 可 以 不 依赖 其 他 
外 部 文档 。 解 决 方法 见 图 17-18。 

查询 的 第 一 个 部 分 定义 了 函数 extractClasses()。 这 个 函数 接受 一 个 元 素 ， 并 返回 一 个 元 素 
列表 。 返回 的 类 型 是 用 LIST(AnyElement) 指 定 的 ， 共 中 LIST 是 一 个 列表 类 型 构造 器 ， 
AnyElement 是 所 有 元 素 的 类 型 。 霄 数 结果 由 一 个 简单 查询 得 到 ， 它 侦 历 函 数 参 数 的 所 有 
CrsTaken 子 孙 ， 略 过 Grade 属性 ， 把 Class 元 素 列 表 作为 结果 输出 。 

溯 数 定义 下 面 是 主 查询 。 它 返回 一 个 顶层 标记 是 Rosters 的 文档 ， 顶 层 标记 包含 用 
ClassRoster 标 记 的 不 同 元 素 的 列表 。 这 个 查询 与 图 17-16 的 查询 几乎 相同 ， 只 是 变量 $c 的 范围 
变 成 了 由 extractClasses() 函 数 产 生 的 结果 。 同 时 ，WHERE 语 名 也 被 去 掉 ， 替 换 成 了 与 变量 $tl 
绑 定 的 XPath 表达 式 上 的 选择 条 件 。(XPath 表 达 式 上 的 选择 条 件 在 17.4.1 节 中 介绍 。) 

用 户 定义 函数 的 最 后 一 个 例子 说 明 XQuery 如 何 实现 在 讲述 XSLT 时 讨论 的 文档 转换 。 我 们 
重 写 了 图 17-14 的 XSLT 样 式 表 ， 这 个 样式 表 可 以 遍历 一 个 XML 文 档 ， 并 且 把 属性 换 成 名 称 和 
内 容 相同 的 元 素 。 该 程序 的 等 价 查询 如 下 : 


FUNCTION convertAttribute(AnyAttribute $a) RETURNS AnyElement{ 
LET $name := name($a) 
RETURN 
<$name>value ($a) </$name> 


全 ”回忆 一 下 ， 通 配 符 “*” 选 择 当前 节点 的 所 有 元 素 子 节点 ， 所 以 $e/* 返 回 赋 给 $e 的 节点 的 子 节点 的 所 有 元 
O 有 兴趣 的 读者 可 以 参考 [XQuery 2001]. 
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} 
FUNCTION convertElement (AnyElement $e) RETURNS AnyElement{ 
LET $name := name($e) 
RETURN 
<$name> 
convertAttribute ($e/e*) 
IF empty($e/*) THEN $e/text() 
ELSE convertElement ($e/*) 
</$name> 


} 


RETURN convertElement (document ("....")/*) 


FUNCTION extractClasses(AnyElement $e) 
RETURNS LIST (AnyElement) { 
FOR $c IN $e//CrsTaken 
RETURN <Class CrsCode=$c/@CrsCode Semester=$c/@Semester/> 
} 


<Rosters> 
( 
LET $trs := document ("http://xyz.edu/transcripts.xml") 
FOR $c IN distinct (extractClasses($trs) ) 
RETURN 
<ClassRoster CrsCode=$c/@CrsCode Semester=$c/@Semester> 


( 


FOR $t1 IN $trs//Transcript [CrsTaken/@CrsCode=$c/@CrsCode and 
CrsTaken/@Semester=$c/@Semester] 


RETURN 
$t1/Student 
SORTBY ($t1/Student/@eStudId) 
) 
</ClassRoster> 
) 
</Rosters> 





图 17-18. 使 用 用 户 定义 的 函数 来 构造 班级 花 名 册 


这 个 查询 包含 一 个 对 预先 定义 的 函数 convertElement() 的 调用 ， 这 个 函数 的 参数 是 一 个 元 
素 节 点 。 在 本 例 中 ， 参 数 是 文档 根 的 孩子 节点 9 。 注 意 ， 因 为 具有 良好 结构 的 XML 文 档 只 有 
一 个 顶层 元 素 ， 所 以 没有 必要 用 FOR 语句 这 样 的 迭代 结构 。 

第 一 个 函数 convertAttribute() 把 属性 节点 作为 参数 并 且 把 它 转换 成 同名 的 元 素 (名 字 通 过 
调用 XPath 函 数 name() 得 到 )。 属 性 值 (ict XQuery MFvalue GH) 则 作为 元 素 的 内 容 。 

第 二 个 函数 convertElementO 是 这 个 查询 的 主要 部 分 。 它 用 来 把 一 个 元 素 节点 转换 成 无 属 
性 的 同名 元 素 。 对 给 定 的 节点 来 说 ，convertElement() 输 出 同名 标记 对 (又 用 到 了 nameO 函 数 )， 
然后 转换 元 素 属 性 ， 最 后 处 理 它 的 元 素 文 本 子 节 点 。 为 转换 属性 ， 它 对 元 素 的 属性 列表 调用 


O ”我 们 忽略 了 根 可 能 有 其 他 孩子 的 可 能 性 ， 例 如 注释 和 处 理 指令 。 
O 即使 文档 的 根 有 多 个 元 素 子 节点 ， 但 (17.4) 使 我 们 无 需 使 用 FOR 语句 。 
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convertAttributeO 国 数 。 。 因 为 convertAttribute() 的 参数 是 一 个 属性 ， 所 以 函数 会 分 别 对 每 个 
属性 应 用 ， 并 产生 一 个 元 素 列表 。 这 是 按照 XQuery 的 一 般 惯例 (17.4) 完成 的 。 

处 理 完 属性 之 后 ，convertElement() 转 向 处 理 文本 节点 和 元 素 。 如 果 元 素 没有 元 素 子 节点 
《由 emptyO 国 数 决定 ) °, 那么 唯一 的 孩子 一 定 是 文本 节点 (如 果 元 素 为 空 ， 那么 什么 也 没有 )。 
在 第 一 种 情况 下 ， 如 果 文 本 节点 存在 就 将 它 发 布 ; 在 第 二 种 情况 下 ， 它 通过 递归 调用 自身 来 
转换 当前 节点 的 元 素 子 节点 。 一 个 元 素 列表 再 一 次 传递 给 参数 为 一 一 个 元 素 的 函数 ， 所 以 对 
convertElementO 的 调用 输出 了 转换 后 的 元 素 列 表 。 

上 面 的 查询 与 图 17-14 的 XSLT 样 式 表 产生 的 转换 不 完全 一 样 。 例 如 ， 如 果 一 个 元 素 具 有 
混合 内 容 〈 它 们 孩子 既 包 含 元 素 又 包含 文本 节点 8 )， 那 么 查询 略 过 文本 (因为 XPath 表达 式 
$e/* 只 选择 元 素 子 节点 )， 并 转换 元 素 。 我 们 在 解释 了 XQuery、XML Schemas 和 命名 空间 的 关 
系 后 再 说 明 如 何 解决 这 个 问题 。 

5. XQuery 和 数据 类 型 

”前 面 的 查询 中 展示 了 像 integer、 AnyElement 和 AnyAttribute 这 些 基本 类 型 的 用 法 。 然 而 ， 

过 与 XML Schema 规范 的 紧密 结合 ， 以 及 允许 引入 和 使 用 XML Schema 中 定义 的 类 型 ， 
rnea ieee ASTER, 事实 上 ， 前 面 使 用 的 基本 类 型 integer 不 是 XQuery 中 固有 的 类 型 ， 
而 是 在 XML Schema 规范 中 定义 的 ， 所 以 它 应 该 和 对 应 的 命名 空间 共同 使 用 。 同 样 地 ， 
AnyElement 和 AnyAttribute 类 型 也 一 定 是 在 某 个 模式 中 定义 的 。 简 单 地 说 ， 我 们 把 它们 当成 
XML Schema 规范 的 一 部 分 。 我 们 也 假装 AnyText 类 型 (包含 文档 树 中 的 所 有 文本 节点 ) 是 在 
标准 XML Schema 命名 空间 中 定义 的 。 

下 面 是 一 个 例子 ， 它 说 明 XQuery 与 XML Schema 和 命名 空间 的 结合 ， 并 且 提 供 了 一 个 真 
正 等 价 于 图 17-14 中 XSLT 样 式 表 的 XQuery 来 完成 了 前 面 的 例子 。 首 先 ， 我 们 需要 定义 一 个 新 
的 简单 数据 类 型 ， 它 可 以 接受 属性 、 元 素 和 文本 节点 。 我 们 假设 这 个 数据 类 型 在 
http://types.r.us/auxiliary 的 命名 空间 中 描述 。 


<schema xmlns="http://www.w3.org/2001/XMLSchema" 
targetNamespace="http://types.r.us/auxiliary"> 
<simpleType name="AnyNode"> 
<union memberTypes="AnyElement AnyAttribute AnyText"/> 
</simpleType> 
</schema> 
假设 这 个 模式 存储 在 URL http://types.r.us/auxiliary/types.xsd 文 档 中 。 图 17-19 显 示 了 我 们 正在 
寻找 的 XQuery 表 达 式 。 
第 一 个 语句 schema 告 诉 XQuery 处 理 器 去 哪里 寻找 查询 中 使 用 的 模式 。 在 本 例 中 ， 这 个 模 
式 包含 联合 类 型 AnyNode 的 定义 ,我 们 在 函数 convertrNode() 中 使 用 了 这 个 类 型 。 两 个 
NAMESPACE 语 句 引 人 了 查询 中 使 用 的 命名 空间 。 命 名 空间 XMLSchema 使 处 理 器 知道 查询 中 
的 AnyElement、AnyAttribute 和 AnyText 类 型 是 在 XML Schema 规范 中 定义 的 基本 类 型 ， 而 其 


O 回忆 一 下 ，@* 是 一 个 返回 元 素 的 所 有 属性 的 通配符 。XPath 国 数 text() 返 回 当前 节点 的 所 有 文本 子 节点 。 

© 在 这 种 情况 下 ， 元 素 有 这 种 <foo> some text </foo> 格 式 。 

© 例如 ，<foo> some text <bar> more text </bar> even more </foo> 有 混合 内 容 ， 有 两 个 文本 子 元 素 和 一 个 元 素 
子 元 素 。 
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他 的 数据 类 型 则 不 是 。 另 一 个 命名 空间 auxiliary 把 AnyNode 和 上 个 模式 中 定义 的 简单 类 型 关联 
在 一 起 。 注 意 ， 这 个 命名 空间 和 定义 AnyNode 的 模式 文档 中 的 目标 命名 空间 相 匹 配 。 


SCHEMA "http://types.r.us/auxiliary/types.xsd" 
NAMESPACE aux = "http://types.r.us/auxiliary" 
NAMESPACE xsd = "http://www.w3.org/2001/XMLSchema" 
FUNCTION convertNode(aux:AnyNode $n) RETURNS aux:AnyNode { 
LET $name := name($n) 
RETURN 
IF $n INSTANCEOF xsd:AnyElement THEN { 
<$name> 
convertNode ($n/@*) 
convertNode ($n/node() ) 
</$name> 
} ELSEIF $n INSTANCEOF xsd:AnyAttribute THEN { 
<$name> 
value($n) 
</$name> 
} ELSE $n 
} 


RETURN convertNode(document("....")/*) 





图 17-19 与 图 17-14 的 样式 表 功 能 相同 的 XQuery 转 换 


查询 中 唯一 的 新 特性 是 操作 符 INSTANCEOF ， 它 测试 一 个 给 定 的 节点 (本 例 中 是 $n 的 值 ) 
是 否 属于 一 个 给 定 的 类 型 。 我 们 用 这 个 操作 符 在 函数 convertNode() 中 测试 这 个 函数 的 参数 是 
否 是 属性 节点 或 元 素 。 

convertNode() 函 数 的 工作 原理 类 似 于 先前 我 们 提 过 的 convertElement()。 它 先 检 查 参数 类 
型 。 如 果 是 一 个 元 素 ， 就 创建 合适 的 标记 对 。 在 标记 之 间 ，convertNode() 被 递归 调用 ， 从 而 
把 当前 元 素 的 属性 转换 成 元 素 ; 然后 被 调用 来 转换 当前 节点 的 所 有 元 素 文本 子 节点 9 。 如 果 
参数 是 属性 ， 那 么 属性 值 被 输出 ， 其 中 具有 与 当前 属性 同名 的 标记 对 。 如 果 参 数 既 不 是 属性 
也 不 是 元 素 ， 那 么 它 一 定 是 文本 节点 ， 在 这 种 情况 下 就 简单 的 把 节点 复制 到 结果 文档 中 。 

6. 分 组 和 聚合 

和 SQL 不 同 ，XQuery 没 有 使 用 单独 的 分 组 操作 符 ; 取而代之 的 是 ， 它 使 用 一 种 更 为 可 靠 
的 机 制 ， 这 种 机 制 应 用 聚合 函数 来 显 式 地 构造 文档 节点 的 集合 。 这 是 利用 我 们 已 经 熟悉 的 
LET 语 名 来 实现 的 ，LET 语 句 声明 了 一 个 变量 并 且 用 一 个 由 XQuery 表 达 式 指定 的 节点 集 来 初 
始 化 变量 。 有 趣 的 是 ， 就 像 我 们 在 前 面 看 到 的 例子 那样 ， 在 FOR 语句 范围 外 使 用 LET 语 句 仅 
仅 是 语法 上 的 优点 ， 但 是 我 们 必须 把 它 放 在 FOR 语句 的 范围 内 ， 因 为 别 的 方法 不 能 实现 分 组 。 

为 了 说 明 这 个 问题 ， 下 面 的 查询 利用 图 17-15 的 Transcripts 文 档 产 生 了 一 个 文档 ， 新 文档 
列 出 了 学 生 和 目前 为 止 该 学 生 选 修 过 的 课程 数 。 


FOR $t IN document ("http://xyz.edu/transcripts.xml")//Transcript, 
$s IN $t/Student 
LET $c := $t/CrsTaken 


日 ” 同 忆 一 下 ,nodeO 是 一 个 返回 当前 节点 的 所 有 元 素 文本 子 节点 的 XPath 函 数 。 
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RETURN 
<StudentSummary StudId=$s/@StudId Name=$s/@Name 
TotalCourses=count (distinct ($c))/> 

SORTBY (StudentSummary/@TotalCourses) 

FORTS 38 ESB CHP Transcript tR LEKER. RAW Te, Bs 
绑 定 到 一 个 新 的 元 素 上 时 ， 变 量 $c 被 赋予 一 个 新 的 CrsTaken 元 素 列表 ， 因 为 LET 是 在 绑 定 $t 的 
FOR 语句 范围 内 发 生 的 。 换 名 话说， 对 $t 的 每 个 Transcript 绑 定 ，$c 被 绑 定 在 那个 transcript 元 
素 提 到 的 班级 列表 上 ， 随 后 调用 count0 来 计算 列表 中 不 同 的 元 素数 。 . 

FOR 语句 和 LET 语 名 之 间 的 相似 性 使 它们 容易 被 搞 错 。 它 们 都 是 把 变量 绑 定 在 一 个 文档 
节点 集 上 ， 但 是 FOR 把 变量 逐个 绑 定 在 集合 中 的 节点 上 ， 而 LET 一 次 就 把 变量 绑 定 在 整个 节 
点 集 上 。 

下 一 个 查询 稍微 复杂 一 点 ， 因 为 它 涉及 到 图 17-15 中 Transcripts 文 档 与 图 17-17 中 Classes 文 
档 的 联结 。 它 创建 了 一 个 班级 列表 ， 每 个 班级 带 有 它 的 平均 分 数 。 为 得 到 分 数 的 数字 值 R 
们 使 用 numericGrade() 函 数 ， 这 个 函数 可 以 很 容易 地 定义 成 XQuery 函 数 ( 这 里 省 略 了 )。 这 个 
例子 也 说 明了 另 一 个 重要 的 特性 : LET 语 句 (或 FOR 语 句 ) 中 的 变量 绑 定 不 一 定 需要 指定 为 
XPath 表达 式 ， 但 可 以 是 任何 返回 一 列 节 点 的 XQuery 表 达 式 。 特 别 地 ， 它 可 以 是 下 面 的 查询 : 

FOR $c IN document ("http://xyz.edu/classes.xml")//Class 

-- $g gets the collection of all numeric grades in the class bound to $c 

LET $g := ( 

FOR $ct IN document ("http://xyz.edu/transcripts.xml") 

//CrsTaken 
WHERE $ct/@CrsCode = $c/@CrsCode 
AND $ct/@Semester = $c/@Semester 
RETURN numericGrade($ct/@Grade) 
) 
RETURN 
<ClassSummary CrsCode = $c/@CrsCode Semester=$c/@Semester 

CsrName = $c/CrsName Instructor=$c/Instructor 
AvgGrade = avg($g)/> 

SORTBY (ClassSummary/@CrsCode) 

这 本 质 上 与 前 面 介绍 的 通过 联结 transcripts.xml 和 classes xml 来 构造 班级 花 名 册 的 查询 相 
同 。 然 而 ， 在 这 个 例子 中 ， 我 们 并 没有 在 结果 文档 中 列 出 班级 所 有 的 学 生 ， 而 是 计算 出 班级 
的 分 数列 表 并 用 LET 语 句 把 它 赋值 给 变量 $g。 然 后 ， 求 分 数 的 平均 值 ， 而 后 把 结果 当 作 属性 
AvgGrade 的 值 。 

注意 ， 当 LET 语 名 在 FOR 语句 的 范围 内 出 现时 ， 它 引入 了 一 个 关系 到 查询 语义 的 新 问题 。 
这 是 因为 FOR 和 LET 语 句 都 可 以 绑 定 变量 造成 的 。LET 语 名 用 下 面 的 方式 合并 到 计算 机 制 中 。 
对 FOR 语句 中 变量 的 每 个 元 组 绑 定 ，LET 语 句 中 变量 绑 定 是 确定 的 。 和 FOR 变量 的 绑 定 不 同 ， 
LET 语 名 是 绑 定 在 一 列 节 点 上 ， 这 一 列 节 点 一 般 作为 聚合 函数 的 参数 。 因 此 ，LET 变 量 的 绑 定 
是 完全 由 FOR 变量 的 绑 定 决 定 的 。 

查询 计算 过 程 的 其 余部 分 保持 不 变 : WHERE 语句 把 FOR 语句 中 产生 的 绑 定 元 组 过 滤 。 现 
在 唯一 的 不 同 是 ，WHERE 中 的 条 件 也 可 以 使 用 LET 绑 定 的 变量 。 最 后 ， 对 FOR 变量 绑 定 的 每 
个 元 组 ，RETURN 语 句 为 结果 文档 产生 一 个 片段 。 
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7. 量化 

假设 我 们 想 查 询 选 修 课 程 MAT123 的 所 有 学 生 。 在 SQL 中 ， 我 们 需要 使 用 EXISTS 操 作 符 
(类 似 于 XQuery 中 的 empty0) 函 数 )。XQuery 通 过 量词 SOME 和 EVERY 提 供 了 相似 的 能 力 ， 它 
们 对 应 于 关系 演算 (参见 第 7 章 ) 中 的 存在 量词 (3) 和 全 称 量词 (V)。 第 7 章 介绍 过 ， 显 式 
地 使 用 量词 使 查询 的 构造 过 程 比 SQL 中 查询 的 构造 过 程 简化 很 多 。 

下 面 的 查询 使 用 了 SOME 量 词 来 返回 选修 MAT123 的 学 生 列表 。 


FOR $t IN document ("http://xyz.edu/transcripts.xml")//Transcript 
WHERE SOME $ct IN $t/CrsTaken 

SATISFIES $ct/@CrsCode = "MAT123" 
RETURN $t/Student 


在 很 多 情况 下 , 查询 中 可 以 不 用 SOME 量 词 。 例 如 , 假设 一 个 学 生 不 能 选 两 个 同样 的 课程 ， 
那么 上 面 的 查询 可 以 改 为 


FOR $t IN document ("http://xyz.edu/transcripts.xml")//Transcript, 
$c IN $t/CrsTaken 

WHERE $c/@CrsCode = "MATi23" 

RETURN $t/Student 


但 是 ，SQL 和 XQuery 之 间 不 是 能 完全 对 应 的 。 考 虑 下 面 的 查询 ， 它 返回 至 少 有 一 个 学 生 
注册 的 所 有 课程 名 。SQL 查 询 是 


SELECT C.CrsName 


FROM CLASS C, TRANSCRIPT T 

WHERE C.CrsCode = T.CrsCode AND C.Semester = T.Semester 
XQuery # AE 

FOR $c IN document ("http://xyz.edu/classes.xml")//Class, 


$t IN document ("http://xyz.edu/transcripts.xml")//CrsTaken 

WHERE $c/@CrsCode = $t/@CrsCode AND $c/@Semester = $t/@Semester 

RETURN $c/CrsName 

因为 T 没 有 出 现在 SELECT 语句 中 ，$t 设 有 出 现在 RETURN 语 句 中 ， 所 以 假设 这 两 者 存在 
量化 。 在 这 两 个 例子 中 ， 即 使 只 有 一 条 匹配 的 transcript 记 录 ， 课 程 名 也 会 被 输出 。 如 果 找 到 
了 多 条 记录 ，SQL 查 询 处 理 器 根据 查询 优化 器 的 内 部 工作 原理 决定 是 否 输 出 重复 的 课程 名 。 
(因为 SQL 是 一 个 关系 查询 语言 ， 它 的 语义 意味 着 对 每 门 课程 名 字 只 输出 一 次 。 重 复 的 可 能 性 
是 实现 的 一 个 细节 。) 相反 ，XQuery 中 的 FOR 语句 的 语义 表示 对 每 个 匹配 的 transcript 记 录 都 输 
出 一 次 课程 名 。 这 是 因为 ，FOR 指 定 了 一 个 循环 ， 在 这 个 循环 中 ，RETURN 语 名 对 每 个 gc 和 
$t 的 绑 定 都 要 执行 一 次 ， 而 且 对 每 个 gc 的 绑 定 可 能 会 有 多 个 对 $t 的 匹配 绑 定 。 

注意 ， 在 SQL 中 用 SELECT DISTINCT 可 以 确保 没有 重复 ,但 在 XQuery 中 使 用 distinct0) 函 数 
却 不 能 轻松 地 达到 相同 的 目的 ( 见 练习 17.30)。 在 本 例 中 ， 消 除 重复 的 一 种 方法 是 使 用 distinct() 
和 filter0 函 数 ( 见 练习 17.31)。 另 一 种 方法 是 使 用 SOME。 然 而 ， 不 同 于 前 面 查询 选修 了 MAT123 
的 所 有 学 生 的 例子 ， 在 这 个 例子 中 量词 很 关键 ， 不 能 只 是 把 变量 从 WHERE 移动 到 FOR。 


FOR $c IN document ("http://xyz.edu/classes.xml")//Class 
WHERE 
SOME $t IN document ("http://xyz.edu/transcripts.xml")//CrsTaken 
SATISFIES $c/@CrsCode = $t/@CrsCode AND $c/@Semester = $t/@Semester 
RETURN $c/CrsName 
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与 存在 量词 相反 ， 全 称 量 词 EVERY 在 大 多 数 查 询 中 都 不 能 被 去 掉 。 第 7 章 讨论 过 ， 用 全 
称 量词 可 以 自然 地 表达 涉及 关系 代数 中 除法 操作 的 查询 。 这 样 的 查询 在 SQL 中 看 起 来 很 笨拙 ， 
因为 SQL 不 直接 支持 全 称 量词 9 。 为 说 明 这 一 点 ， 下 面 的 例子 查询 其 中 所 有 学 生 都 选修 
MAT123 的 班级 : 


FOR $c IN document ("http://xyz.edu/classes.xml")//Class 
-~ $g gets bound to the set of all Transcript elements 
-- corresponding to the particular class that binds $c 
LET $g := ( 
FOR $t IN document ("http://xyz.edu/transcripts.xml") 
//Transcript 
WHERE $t/CrsTaken/@CrsCode = $c/@CrsCode 
AND $t/CrsTaken/@Semester = $c/@Semester 
RETURN $t i 
) 
~~ Take only those $g in which every transcript 
-- hasa CrsTaken element for MAT123 
WHERE EVERY $tr IN $g 
SATISFIES NOT empty ($tr[CrsTaken/@CrsCode = "MAT123"]) 
RETURN $c SORTBY($c/@CrsCode) 
这 里 ， 每 次 把 $c 绑 定 到 Class 元 素 上 时 ，$g 就 被 绑 定 到 选修 这 门 课 的 学 生 的 成 绩 单 列表 上 。 
外 层 的 WHERE 语 句 检查 是 否 $g 中 的 每 个 学 生 都 选修 了 MAT123。( 回想 XPath 表 达 式 
$tr[CrsTaken/@CrsCode="MAT123"] 返 回 一 个 非 空 节 点 集 ， 条 件 是 当 且 仅 当 $tr 被 绑 定 到 一 个 


含有 与 课程 MAT123 对 应 的 CrsTaken 元 素 的 transcript 元 素 上 .) 
17.4.4 小 结 


本 节 介 绍 了 XML 的 三 种 查询 语言 。XPath 是 一 种 轻 量 级 的 语言 ， 它 已 经 成 为 一 些 XML 相 
关 技 术 的 不 可 筷 少 的 一 部 分 。 我 们 在 本 章 中 已 经 见 到 了 一 些 这 样 的 技术 : XML Schema, 
XPointer、XSLT 和 XQuery。 

XSLT 是 一 种 XML 转换 语言 。 它 没 被 设计 成 一 种 查询 语言 ， 但 是 ， 因 为 它 使 用 了 XPath 和 
它 全 面 的 设计 ， 所 以 它 适 合 很 多 种 XML 查询 ， 特 别 是 那些 不 涉及 文档 联结 的 查询 。 

XQuery 是 一 种 折 中 的 语言 ， 是 建立 在 数据 库 世 界 中 产生 的 思想 上 的 。 它 还 没有 完全 成 熟 ， 
一 些 语 法 和 语义 都 有 可 能 改变 。 然 而 ， 即 使 在 目前 的 形态 上 ，XQuery 也 阐明 了 怎样 把 关系 数 
据 库 和 面向 对 象 数据 库 中 产生 的 一 些 思 想 应 用 到 查询 和 重 构 文档 上 。 

目前 ，XPath 和 XSLT 都 受到 W3C 的 推荐 ， 并 且 它 们 都 已 经 得 到 大 多 数 Web 浏 览 器 的 支持 。 
在 写 这 本 书 时 ，XQuery 的 规范 还 只 是 一 个 初步 的 草稿 [XQuery 2001]。 


17.5 参考 书目 
XML 试 图 给 Web 信 息 处 理事 务 的 混乱 状态 带 来 一 些 秩序 。 从 概念 上 说 ， 它 是 SGML 标 准 [SGM 1986] 
的 重 写 和 简化 。 版 本 1 在 1998 年 通过 ， 并 且 成 为 一 种 被 广泛 接受 的 标准 [XML 1998]。 和 每 个 新 的 热门 话 


O 我 们 在 6.2.3 节 说 明了 在 SQL 中 表示 全 称 量词 需要 使 用 EXISTS、 储 套子 查询 和 双重 否定 。 然 而 ，SQL:1999 引 
入 了 全 称 量词 的 一 种 有 限 形式 一 一 FOR ALL 操 作 符 , 它 减 轻 了 编写 需要 关系 代数 中 除法 操作 符 的 查询 的 痛苦 。 
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题 一 样 ， 在 短 时 间 内 出 现 了 很 多 讨论 它 的 出 版 物 。 因 为 其 数量 太 多 而 不 能 一 一 列 出 这 些 出 版 物 ， 所 以 我 
们 只 提 及 最 近 的 两 本 著作 : [Ray 2001, Bradley 2000a], 

XML Schema 在 很 多 书 中 都 有 所 介绍 ， 但 是 因为 它 到 目前 为 止 还 尚未 成 熟 ， 所 以 我 们 推荐 原始 资料 
[XMLSchema 2000a, XMLSchema 2000b]。 

XPath 是 XML 路 径 表达 式 语 言 ， 在 大 多 数 最 近 关 于 XML 的 著作 中 都 有 所 描述 。 可 以 在 [XPath 1999] 
中 找到 W3C 的 官方 推荐 标准 。 路 径 表 达 式 的 最 初 想法 来 源 于 [Zaniolo 1983]。 利 用 查询 能 力 增加 路 径 表 
达 式 的 想法 在 [Kifer and Lausen 1989, Kifer et al. 1992, Frohn et al. 1994, Abiteboul et al. 1997, Deutsch et 
al. 1998] 及 其 他 著作 中 均 有 提 及 。 

XSLT 在 1999 年 成 为 W3C 的 官方 推荐 标准 [XSL 1999]， 并 且 大 多 数 主流 浏览 器 的 最 新 版 本 都 支持 它 ， 
如 Internet Explorer、Mozilla、Netscape。 一 些 著作 中 含有 XSLT 的 主题 ， 如 [Kay 2000, Bradley 2000b]。 

XML 查 询 语言 XQuery 在 [XQuery 2001] 中 描述 。 它 是 一 种 折 中 的 语言 ， 建 立 在 之 前 的 SQL、 
OQLICattell and Barry 2000]. XQL[Robie et al. 1998], XML-QL[Deutsch et al. 1998, Florescu et al. 1999] 
以 及 Quilt{Robie et al. 2000, Chamberlin et al. 2000] 等 几 种 语言 的 思想 之 上 。XQuery 仍 然 处 于 不 断 的 完善 
之 中 ， 了 解 XQuery 进 展 的 最 佳 地 方 是 W3C XML 查询 工作 组 的 Web 站 点 http://www.w3.org/XML/Query。 

最 后 ，[Abiteboul et al. 2000] 是 一 本 优秀 的 参考 书 ， 它 采用 Web 上 信息 处 理 的 数据 库 观点 ， 并 且 涵 
盖 了 半 结 构 化 数据 的 最 新 研究 ， 包 括 Lorel 和 XML-QL (XQuery 的 两 个 先驱 )。 


17.6 练习 


17.1 使 用 XML 表示 图 4-2 中 STUDENT 关系 的 内 容 。 为 这 个 文档 定义 一 个 合适 的 DTD。 
17.2 设 某 文 档 包含 图 5-15 的 COURSE 表 和 图 5-16 的 REQUIRES 表 中 的 数据 ， 为 该 文档 定义 一 个 合适 的 
DTD。 根 据 这 些 DTD 写 出 相应 的 约束 。 给 出 一 个 符合 你 的 DTD 的 文档 。 
17.3 重新 组 织 图 17-4 的 文档 结构 ， 用 合适 标记 将 元 素 Name、Status、CrsCode、Semester 和 CrsName 全 
部 替换 成 属性 。 给 出 适合 这 个 文档 的 DTD。 描 述 所 有 可 用 的 ID 和 IDREF 约 束 。 
17.4 定义 下 列 简单 类 型 : 
a. 这 种 类 型 的 域 由 字符 串 列 表 组 成 ， 每 个 列表 由 7 个 元 素 组 成 。 
b. 这 种 类 型 的 域 由 字符 串 列 表 组 成 ， 每 个 字符 串 长 度 为 7。 
c. 这 种 类 型 的 域 是 一 个 字符 串 列表 集合 ， 每 个 字符 串 有 7 ~ 10 个 字符 ， 并 且 每 个 列表 有 7 ~ 10 个 
元 素 。 
d. 这 种 类 型 适合 用 字母 表示 学 生 在 完成 课程 之 后 取得 的 成 绩 -一 --A、A-、B+、B、B-、C+、C、 
C 一 、D 和 F。 用 两 种 方式 表示 这 种 类 型 : 用 枚 举 型 或 用 XML Schema 中 的 pattern 标 记 。 
17.5 使 用 XML Schema 中 的 key 语 句 来 为 图 17-4 的 文档 定义 下 面 的 键 约束 : 
a. 所 有 Student 元 素 集 的 键 。 
b. 所 有 Course 元 素 集 的 键 。 
c. 所 有 Class 元 素 集 的 键 。 
17.6 假设 图 17-4 文 档 中 任何 学 生 都 可 以 由 last name 和 status 唯 一 确定 。 定 义 这 个 键 约束 。 
17.7 使 用 XML Schema 的 keyref 语 句 为 图 17-4 的 文档 定义 下 面 的 参照 完整 性 : 
a. CourseTaken 元 素 中 每 个 课程 代码 必须 对 应 一 门 有 效 的 课程 。 
b. Class 元 素 中 的 每 个 课程 代码 必须 对 应 一 门 有 效 的 课程 。 
17.8 为 图 17-4 的 文档 描述 以 下 的 约 东 : 在 相同 的 Student 元 素 中 ， 没 有 一 对 CourseTaken 元 素 有 相同 的 
CrsCode 属 性 值 。 
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17.9 重新 安排 图 17-4 中 Class 元 素 的 结构 ， 使 得 该 元 素 可 以 定义 下 面 的 参照 完整 性 : 在 Class 元 素 中 涉及 
的 每 个 学 生 Id 对 应 同一 文档 中 的 一 个 学 生 。 
17.10 编写 一 个 统一 的 XML Schema 来 涵盖 图 17-15 和 17-17 的 文档 。 提 供 合适 的 主键 和 外 键 约 束 。 
17.11 用 XML Schema 来 表示 图 4-6 中 的 关系 模式 片段 ， 其 中 包括 所 有 的 键 和 外 键 约 束 。 
17.12 用 XPath 来 表示 以 下 对 图 17-15 文 档 的 查询 : 
a. 查找 所 有 Id 以 987 结 尾 并 且 选 修 课 程 MAT123 的 Student 元 素 。 
b. 查找 所 有 first name 是 Joe 并 且 选 修 少 于 3 门 课 程 的 Student 元 素 。 
c. 查 找 所 有 对 应 学 期 S1996 并 且 属 于 名 字 以 P 开 头 的 学 生 的 CrsTaken 元 素 。 
17.13 为 图 17-17 的 文档 构造 下 列 XPath 查 询 : 
a. 查找 在 1995 年 秋季 由 Mary Doe 教 授 的 所 有 课程 名 字 。 
b. 查找 所 有 在 1996 年 秋季 开设 的 课程 名 字 对 应 的 节点 和 所 有 教授 MAT123 的 教师 对 应 的 节点 。 
c. 查找 在 1997 年 春季 由 John Smyth 教 授 的 所 有 课程 的 代码 的 集合 。 
17.14 用 XSLI 把 图 17-15 中 的 文档 转换 成 一 个 具有 良好 格式 的 XML 文档 ， 这 个 文档 要 包含 所 有 选修 1996 
年 春季 所 开设 课程 的 Student 元 素 的 列表 。 
17.15 用 XSLT 把 图 17-17 中 的 文档 转换 成 一 个 具有 良好 格式 的 XML 文档 ， 这 个 文档 要 包含 在 1997 年 秋季 
由 Ann White 教授 的 课程 列表 。 输 出 中 不 要 包含 子 元 素 Instructor 和 Semester 属 性 。 
17.16 编写 一 个 遍历 文档 树 的 XSLT 样 式 表 ， 忽 略 属性 、 元 素 拷贝 和 文本 节点 。 例 如 ，<foo a="1"> 
the<best quality="S"/>bar</foo> 将 被 转换 成 <foo>the<best />bar</foo>。 
17.17 编写 一 个 遍历 文档 树 的 XSLT 样 式 表 ， 忽 略 属 性 、 复 制 元 素 拷贝 并 使 文本 节点 翻 倍 。 例 如 ， 
<foo a="1">the<best />bar</foo> 将 被 转换 成 <foo>thethe<best/>barbar</foo>。 
17.18 编写 一 个 遍历 文档 树 的 XSLT 样 式 表 ,保留 所 有 元 素 、 属 性 、 文 本 节点 ， 不 过 要 去 掉 CrsTaken 元 
素 。 样 式 表 的 构造 不 允许 依赖 CrsTaken 元 素 在 源 文档 中 的 位 置 。 
17.19 编写 一 个 遍历 文档 树 的 XSLT 样 式 表 ， 略 过 所 有 属性 ， 保 留 树 的 其 他 的 方面 (元素 节点 和 文本 节 
点 间 的 父子 关系 )。 不 过 ， 当 样式 表 碰 上 foobar 元 素 时 ， 它 的 属性 和 它 下 面 的 整个 结构 被 保留 ， 
元 素 本 身 被 重复 两 次 。 
17.20 编写 一 个 遍历 文档 树 的 样式 表 ， 保 留 文档 所 有 内 容 。 但 是 ， 当 它 碰 上 foo 元 素 时 ， 要 求 把 foo 元 素 
的 每 个 文本 子 节点 转换 成 名 字 为 text 的 元 素 。 例 如 : 
<foo a="1">the<best>bar<foo>in the</foo></best>world</foo> 


应 该 转换 成 


<foo a="1">the<best>bar<foo> <text>in the</text> 
</f00></best>world</foo> 


17.21 考虑 图 4-6 的 关系 模式 ， 假 设 Web 服 务 器 用 下 面 的 XML 格式 发 布 这 些 关系 的 内 容 : 关系 名 是 顶层 
元 素 ， 每 个 元 组 用 一 个 tuple 元 素 表 示 ， 每 个 关系 属性 用 一 个 带 有 value 属 性 的 空 元 素 表 示 。 例 如 ， 
STUDENT 关系 表示 如 下 : 
<Student> 

<tuple> 
<Id value="111111111"/> <Name value="John Doe"/> 


<Address value="123 Main St."/> <Status="U1"/> 
</tuple> 


</Student> 


用 XQuery 表 示 下 列 查询 : 





17.22 


17.23 


17.24 


17.25 


17.26 


17.27 


17.28 


17.29 
17.30 
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a. 得 到 所 有 住 在 Main Street 的 学 生 的 列表 。 

b. 找到 CrsCode 值 与 开设 这 门 课程 的 院 系 Id 不 一 致 的 所 有 课程 。( 例如 ， 信 息 系统 中 的 课程 IS315 
可 能 是 由 计算 机 科学 (CS) 系 开设 的 。) 

c. 利用 TEACHING 关 系 ， 对 所 有 秋季 开设 的 课程 的 记录 创建 一 个 列表 。 

对 练习 17.21 描 述 的 文档 结构 ， 用 XQuery 写 出 下 面 的 查询 

a. 为 教授 过 MAT123 的 所 有 教授 创建 列表 。 其 中 必须 包含 PRoFEssoR 关 系 中 的 所 有 属性 。 

b. 为 选修 过 John Smith 的 课 并 且 成 绩 为 A 的 所 有 学 生 (包括 学 生 14 和 name) 创建 列表 。 

c. 为 Joe Public 成 绩 为 A 的 所 有 课程 创建 列表 。 

对 练习 17.21 描 述 的 文档 结构 ， 用 XQuery 写 出 下 面 的 查询 

a. 建立 一 个 XML 文 档 ， 列 出 所 有 学 生 的 名 字 ， 对 每 个 学 生 ， 分 别 列 出 该 生 的 成 绩 单 。 成 绩 单 记 
录 必须 包括 课程 代码 、 学 期 和 成 绩 。 

b. 建立 一 个 XMI 文 档 ， 列 出 每 个 教授 的 名 字 和 他 所 教 的 课程 。 

c. 建立 一 个 文档 ， 列 出 每 门 课程 和 教授 这 门 课 的 教授 。 课 程 信息 必须 包括 课程 名 ， 教 授信 息 应 
该 包含 教授 的 名 字 。 

对 练习 17.21 描 述 的 文档 结构 ， 用 XQuery 写 出 下 面 的 查询 

a. 列 出 选修 的 课程 多 于 3 门 的 所 有 学 生 。 

b. 列 出 三 门 课程 以 为 成 绩 为 A 的 所 有 学 生 。 

c. 列 出 有 3 个 以 上 学 生成 绩 为 A 的 所 有 教授 。 

d. 列 出 平均 成 绩 高 于 B 的 所 有 课程 。 

e 列 出 所 给 平均 成 绩 (每 个 学 生 所 有 成 绩 的 平均 值 ) 等 于 或 高 于 B 的 所 有 教授 。 对 这 个 问题 ， 我 
们 必须 写 一 个 XQuery 函 数 来 比较 用 字母 表示 的 成 绩 。 

f 列 出 平均 成 绩 小 于 教 这 门 课程 的 教授 所 给 的 平均 成 绩 的 所 有 课程 。 

对 练习 17.21 描 述 的 文档 结构 ， 用 XQuery 写 出 下 面 的 查询 

a. 列 出 每 个 学 生 的 成 绩 高 于 B 或 为 B 的 所 有 课程 。 

b. 列 出 成 绩 不 低 于 B 的 所 有 学 生 。 

写 一 个 XQuery 函 数 来 亿 历 一 个 文档 ， 并 计算 出 文档 树 的 最 大 分 支 因 子 ， 即 文档 所 有 元 素 中 的 子 

节点 (文本 或 元 素 节点 ) 的 最 大 数目 。 

写 一 个 XQnery 函 数 来 遍历 一 个 文档 并 去 掉 所 有 元 素 标记 。 例 如 : 


<the>best<foo>bar</foo>in the world</the> 


将 被 转换 成 


<result>bestbarin the world</result> 


考虑 一 个 文档 ， 它 包含 一 个 教授 列表 (姓名 、Id、 院 系 Id) 和 每 个 教授 教 的 课程 列表 (课程 代码 、 

学 期 )。 使 用 京 合 函数 生成 下 面 的 文档 : 

a. 一 个 教授 列表 (姓名 、1d)， 包 含 该 教授 所 教 的 课程 数目 。( 不 同学 期 的 相同 课程 算 一 门 课程 。) 

b. 一 个 院 系列 表 ( 院 系 1d)， 包 含 该 院 系 的 教授 曾经 上 过 的 不 同 的 课程 数 。( 不 同学 期 的 相同 课 
程 或 者 相同 学 期 由 不 同 老师 教 的 同一 门 课程 都 算 作 一 门 课程 。) 

用 filterO) 国 数 重 做 练习 17.28 。 

考虑 下 面 的 查询 : 





468 RERA PLITA ER 


FOR $c IN document ("http://xyz.edu/classes.xml")//Class, 
$t IN document ("http://xyz.edu/transcripts.xml") 
//CrsTaken 
WHERE $c/@CrsCode = $t/@CrsCode 
AND $c/@Semester = $t/@Semester 


RETURN $c/CrsName 
解释 一 下 为 什么 每 个 课程 名 都 会 输出 一 次 以 上 。 用 distinct() 函 数 能 解决 这 个 重复 问题 吗 ? 解 释 你 


的 答案 。 
17.31 考虑 练习 17.30 中 的 查询 。 用 filter0 和 distinct() 来 去 掉 输 出 中 的 重复 部 分 。 
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越 来 越 多 的 应 用 要 求 访问 多 个 在 不 同 地 点 ， 甚 至 在 地 理 上 很 分 散 的 数据 库 。 这 些 应 用 可 
以 分 为 两 大 类 ， 我 们 分 别 用 例子 来 说 明 。 

“第 一 类 : 一 个 网 络 零售 商 建立 了 一 个 全 国 性 的 仓库 网 络 来 加 快 货品 递送 的 速度 。 每 一 个 

仓库 都 有 自己 的 本 地 数据 库 ， 而 在 该 零售 商 的 总 部 也 有 一 个 数据 库 。 一 个 计算 所 有 仓库 

的 库存 的 应 用 在 总 部 的 数据 上 运行 ， 并 访问 各 个 仓库 的 数据 库 。 

“第 二 类 : 当 一 个 顾客 从 该 网 络 零售 商 处 购买 物品 时 ， 这 项 交易 可 能 涉及 这 个 零售 商 积 信 

用 卡 公司 。 关 于 交易 的 信息 必须 同时 保存 于 零售 商 和 信用 卡 公司 两 者 的 数据 库 中 。 

这 两 种 应 用 都 涉及 分 布 式 数据 。 不 同 之 处 在 于 它们 在 单独 站 点 访问 数据 库 的 方式 。 在 第 
一 类 中 ， 应 用 是 以 模式 〈schema) 来 编写 的 ， 它 能 在 SQL 语句 级 访问 数据 库 站 点 。 因 此 ， 它 
可 以 给 每 一 个 仓库 发 送 SELECT 语 名 来 获得 它 想 要 的 信息 ， 然 后 再 合并 返回 的 元 组 。 

第 二 类 应 用 使 用 不 同 的 方法 访问 数据 。 零 售 商 和 信用 卡 公司 是 独立 的 企业 ， 而 且 它 们 的 
数据 库 都 含有 双方 不 愿意 共享 的 敏感 信息 。 此 外 ， 双 方 都 不 愿意 让 对 方 ( 也 许 是 无 意 的 ) 在 
自己 的 数据 库 中 引入 不 一 臻 性。 于是， 信用 卡 公司 提供 一 个 子 例 程 (也许 是 一 段 作为 事务 执 
行 的 存储 过 程 ) 以 供 调 用 来 更 新 数据 库 ， 记 录 对 某 一 顾客 账户 的 扣 款 。 远 程 站 点 可 以 调用 这 
个 子 例 程 ， 但 是 不 能 直接 访问 数据 库 。 因 为 子 例 程 是 由 信用 卡 公司 编写 的 ， 所 以 其 数据 库 的 
安全 性 和 完备 性 就 得 到 保证 。 和 第 一 类 应 用 相 比 较 ， 直 接 远程 访问 信用 卡 公 司 的 数据 库 是 不 
可 能 的 。 

这 两 类 应 用 都 涉及 分 布 式 数据 ， 而 且 如 果 应 用 要 求 有 事务 特性 ， 则 还 涉及 分 布 式 事务 。 
在 第 四 部 分 和 第 15 章 的 事务 处 理 概论 中 我 们 已 经 讨论 过 事务 的 问题 了 。 分 布 式 系统 的 安全 性 
问题 将 会 在 第 27 章 中 讨论 。 

只 有 第 一 类 的 应 用 可 以 直接 访问 数据 ， 因 此 需要 使 用 面向 数据 库 的 策略 来 提高 性 能 和 实 
用 性 。 本 章 将 讨论 这 些 策略 。 例 如 : 

* 应 该 如 何 设计 分 布 式 数据 库 ? 

* 各 个 数据 项 或 表 应 该 存储 在 哪个 站 点 ? 

© 哪些 数据 项 应 该 被 复制 ， 数 据 项 备份 应 该 存储 在 哪个 站 点 ? 

© 如 何 处 理 访问 多 个 数据 库 的 查询 ? 

“分 布 式 查询 优化 涉及 哪些 问题 ? 

© 用 于 查询 优化 的 技术 如 何 影响 数据 库 的 设计 ? 

为 什么 数据 是 分 布 的 

既然 分 布 带 来 新 的 问题 ， 那 么 为 什么 要 分 布 数据 呢 ? 为 什么 不 把 分 布 式 企业 的 所 有 数据 
集中 到 一 个 中 心 站 点 呢 ? 下 面 的 理由 (也许 互相 冲突 的 ) 解释 了 为 何 数据 必须 是 分 布 的 和 它 
们 应 该 放 在 哪里 。 ' 
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“这 样 放置 数据 可 以 减少 通信 代价 和 响应 时 间 。 这 通常 意味 着 数据 被 放 在 最 经 常 访问 它 的 
站 点 。 

“数据 分 布 放置 可 以 平衡 工作 量 ， 使 得 单个 站 点 不 会 因为 过 载 而 影响 到 吞吐 量 。 

“数据 可 以 存放 在 产生 它 的 站 点 ， 以 便 它 的 创造 者 保持 对 它 的 控制 并 保证 安全 性 。 

© 某 些 数据 项 会 在 多 个 站 点 复制 以 增加 它们 在 系统 崩溃 时 的 可 用 性 (如 果 一 个 备份 不 可 用 ， 
那么 其 他 的 备份 还 可 以 被 访问 ) 或 增加 吞吐 量 和 减少 响应 时 间 (数据 可 以 通过 本 地 或 邻 
近 的 副本 而 被 更 快 地 访问 )。 


18.1 应 用 设计 者 对 数据 库 的 观点 


直接 访问 数据 库 的 应 用 提交 根据 某 些 模式 构造 的 SQL 语 句 。 这 些 模式 描述 应 用 所 看 见 的 
数据 库 的 结构 。 我 们 来 考虑 三 种 这 样 的 模式 。 

1. 多 个 本 地 模式 

在 应 用 程序 看 来 ， 分 布 式 数据 库 是 一 系列 独立 的 数据 库 ， 每 一 个 数据 库 都 有 自己 的 模式 ， 
如 图 18-1a 所 示 。 此 类 系统 是 多 数据 库 系统 (multidatabase ) 的 一 个 例子 (关于 多 数据 库 系统 
的 完整 讨论 将 在 21.2.2 节 给 出 )。 如 果 各 个 数据 库 管理 系统 都 是 由 不 同 的 厂商 供应 的 ， 则 称 此 
系统 是 异 构 的 (heterogeneous) ; 如 果 是 由 同一 厂商 供应 的 ， 则 称 此 系统 为 同 构 的 
(homogeneous), 
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a) 具有 本 地 模式 的 多 数据 库 系 统 b) 支持 全 局 模式 的 集成 分 布 式 数据 库 


图 18-1 分 布 式 数据 的 视图 


对 每 一 个 包含 需要 访问 的 数据 项 的 站 点 ， 应 用 程序 都 必须 明确 地 建立 一 个 到 此 站 点 的 连 
楼 。 连 接 建立 后 ， 程 序 可 以 用 根据 此 站 点 模式 构造 的 SQL 语 句 访问 数据 库 ， 如 果 数 据 项 从 一 
个 站 点 移 到 另 一 个 站 点 ， 那 么 必须 修改 程序 。 

5QL 不 支持 在 单个 语句 中 引用 不 同 站 点 上 的 表 ， 例 如 ， 进 行 全 局 的 联结 操作 。 如 果 应 用 
程序 要 联结 不 同 站 点 的 表 ， 它 必须 把 每 张 表 中 的 元 组 读 和 应 用 所 在 站 点 的 缓冲 区 中 〈 用 不 同 
的 SELECT 语句 )， 并 且 显 式 地 为 每 一 对 元 组 测试 联结 条 件 。 

不 同 站 点 的 数据 可 能 是 以 不 同 格式 储存 的 。 例 如 ， 在 一 个 站 点 ， 某 个 人 的 姓 可 能 被 存放 
在 最 前 面 ， 但 在 另 一 个 站 点 ， 姓 可 能 被 存放 在 最 后 。 此 外 ， 各 个 模式 中 的 类型 可 能 会 不 同 . 
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例如 ， 在 一 个 站 点 ，Id 可 能 被 存储 为 一 串 字 符 ; 而 在 另 一 个 站 点 ，Id 却 被 存储 为 整数 。 在 这 些 
情况 下 ， 应 用 必须 提供 对 话 例 程 以 便 在 运行 时 整合 数据 。 

应 用 还 必须 管理 副本 。 当 要 查询 一 个 已 被 复制 的 数据 项 时 ， 应 用 必须 决定 应 该 访问 哪 一 
个 副本 ， 如 果 这 个 数据 项 被 更 新 ， 它 必须 保证 所 有 的 副本 都 被 更 新 。 

我 们 在 第 10 章 讨论 的 用 嵌入 式 SQL、JDBC、SQLJ 和 ODBC 访 问 分 布 式 数据 库 的 方法 都 是 
指 这 种 模式 的 数据 库 。 

2. 全 局 模式 

本 地 模式 的 方案 几乎 对 应 用 程序 设计 者 不 提供 任何 支持 : 所 有 因数 据 库 的 分 布 特性 而 产 
生 的 问题 都 必须 通过 程序 来 解决 。 另 一 个 极端 就 是 ， 所 有 的 问题 都 被 隐藏 于 应 用 之 外 且 自 动 
解决 。 这 很 有 趣 ， 因 为 它 提 供 了 衡量 分 布 式 数据 库 系 统 的 一 个 理想 状态 。 

在 这 个 方法 中 ， 应 用 设计 者 看 到 的 是 一 个 综合 了 各 本 地 模式 的 模式 。 因 此 ， 我 们 称 这 个 
模式 是 全 局 模式 (global schema) ， 并 称 这 个 系统 是 集成 (integrated) 分 布 式 数据 库 系 统 。 

集成 的 工作 是 由 中 间 件 完成 的 ( 见 图 18-1b)， 它 将 各 个 模式 统一 成 一 个 包含 所 有 站 点 数 
据 的 全 局 模式 。 全 局 模式 可 能 含有 不 在 任何 本 地 模式 中 出 现 的 表 ， 但 这 种 表 可 以 由 本 地 模式 
中 的 表 用 适当 的 SQL 语句 计算 出 来 。 换 句 话说， 全局 模式 是 本 地 模式 的 一 个 视图 。 

当 全 局 模式 中 的 元 素 被 访问 时 ， 中 间 件 会 自动 建立 到 各 个 站 点 的 连接 。 因 此 ， 应 用 程序 
是 不 知道 表 所 在 的 位 置 的 (这 称 作 位 置 透明 性 (location transparency ) ) 。 如 果 数 据 项 从 一 个 
站 点 移 到 另 一 个 站 点 ， 那 么 全 局 模式 可 保持 不 变 而 且 应 用 程序 也 不 必修 改 。 全 局 模式 到 本 地 
模式 的 映射 需要 在 中 间 件 中 修改 ， 但 这 比 修改 众多 的 应 用 程序 容易 多 了 。 

就 像 在 本 地 模式 中 一 样 ， 不 同 站 点 的 相关 数据 可 用 不 同 的 格式 或 类 型 来 储存 ， 这 可 能 与 
全 局 模式 中 的 格式 和 类 型 不 符 。 在 这 种 情况 下 ， 中 间 件 提供 了 转换 例 程 以 便 整 合 系统 。 

一 个 与 其 相关 的 问题 是 语义 集成 (semantic integration ) ， 它 至 少 涉及 值 转 换 和 名 转换 的 
问题 。 考 虑 一 个 在 欧洲 、 日 本 和 美国 都 有 站 点 的 分 布 式 数据 库 。 货 币值 在 所 有 站 点 都 可 用 双 
精度 数 表示 ， 所 以 不 需要 进行 格式 转换 。 但 是 ，1000 日 元 和 1000 欧 元 是 不 同 的 ，1000 欧 元 也 
不 同 于 1000 美 元 。 因 此 ， 对 东京 的 销售 总 额 的 查询 可 能 需要 按 汇率 转换 成 日 元 ， 同 样 对 阿 姆 
斯 特 丹 的 查询 就 需要 转换 成 欧元 。 而 属性 名 的 转换 必须 根据 各 地 的 文化 差异 和 习惯 而 定 。 即 
使 不 考虑 阿姆斯特丹 的 站 点 和 纽约 的 站 点 使 用 不 同 语言 的 可 能 性 ， 我 们 还 是 必须 处 理 两 个 不 
同 的 美国 站 点 用 item# 和 part# 来 表示 同一 属性 的 可 能 性 。 

应 用 程序 根据 全 局 模式 来 执行 SQL 语句 。 例 如 ， 应 用 可 能 会 在 全 局 模式 中 请 求 两 个 表 T， - 
和 T: 的 联结 。 如 果 这 两 个 表 在 同一 个 站 点 存储 ， 那 么 语句 会 被 送 到 该 站 点 处 理 。 如 果 它 们 在 
不 同 的 站 点 存储 (全 局 联结 ) ， 那 么 中 间 件 必须 根据 单个 数据 库 的 模式 把 联结 翻译 成 一 系列 恰 
当 的 SQL 语句 并 且 为 计算 联结 执行 其 他 必要 的 操作 。 更 复杂 的 情况 是 ，Ti 和 T: 可 以 看 作 是 由 
中 间 件 用 查询 填充 的 ， 查 询 用 来 联结 储存 在 不 同 站 点 的 关系 。 我 们 将 在 18.3.1 节 讨论 执行 这 些 
全 局 联结 的 技术 。 

应 用 设计 者 可 能 会 复制 一 些 数 据 项 并 为 这 些 副 本 指定 保存 的 站 点 。 但 是 ， 对 应 用 程序 而 
言 ， 复 制 是 隐藏 的 。 程 序 访问 逻辑 数据 项 ， 而 中 间 件 自动 管理 复制 ， 提 供 适 当 的 副本 来 满足 
查询 并 且 在 适当 的 时 候 更 新 所 有 副本 。 这 被 称 为 复制 透明 性 (replication transparency). 
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3. 限制 的 全 局 模式 

应 用 设计 者 看 到 的 是 一 个 全 局 模式 ， 但 这 个 模式 是 各 个 数据 库 模式 的 并 《相对 于 视图 )。 
因此 ， 限 制 的 全 局 模式 包含 各 数据 库 中 所 有 的 表 。 

一 些 同 构 系 统 的 软件 厂商 支持 限制 的 全 局 模式 。 由 这 样 的 厂商 提供 的 数据 库 服务 器 可 以 
直接 合作 ， 无 需 中 间 件 ， 但 仍 如 图 18-1b 那 样 运作 ® 。 

应 用 使 用 一 种 命名 约定 来 表示 各 数据 库 中 的 表 。 因 此 ， 表 的 位 置 就 可 被 隐藏 (位 置 透明 
度 )。 当 一 个 站 点 的 表 被 访问 时 ， 到 该 站 点 的 联结 就 会 自动 建立 。 

应 用 可 以 执行 引用 不 同 站 点 的 表 的 SQL 语句 一 一 例如 ， 一 个 全 局 联结 。 系 统 还 包含 一 个 
全 局 查询 优化 器 来 设计 高 效 的 查询 计划 并 提供 复制 透明 性 。 


18.2 在 不 同 数 据 库 中 分 布 数据 


在 许多 情况 下 ， 数 据 在 不 同 站 点 分 布 不 受 应 用 设计 者 的 控制 。 例 如 ， 由 于 安全 的 原因 某 
些 数 据 项 必须 保存 在 特定 的 站 点 。 在 另 一 些 情况 下 ， 设 计 者 可 以 参与 决定 在 哪里 存放 或 复制 
数据 。 在 这 一 节 中 ， 我 们 将 描述 一 些 关于 数据 分 布 的 问题 。 


18.2.1 分 段 


分 布 数据 的 最 简单 方法 就 是 把 单个 的 表 存 储 在 不 同 的 站 点 。 然 而 ， 表 不 一 定 是 分 布 数据 
的 最 好 单位 。 通 常 一 个 事务 访问 的 只 是 表 的 部 分 行 或 表 的 一 个 视图 ， 而 不 是 整个 表 。 如 果 不 
同 的 事务 访问 表 的 不 同 部 分 且 在 不 同 的 站 点 运行 ， 那 么 将 表 的 一 部 分 储存 在 执行 相应 事务 的 
站 点 上 将 会 提高 性 能 。 当 以 这 种 方式 分 解 表 时 ， 称 表 的 这 些 部 分 为 段 (fragment)。 对 于 此 类 
应 用 ， 段 是 更 好 的 数据 分 布 的 单位 。 

将 表 的 段 作为 分 布 单位 还 有 其 他 的 好 处 。 例 如 ， 在 一 个 很 大 的 表 上 处 理 一 个 查询 需要 很 
多 时 间 ， 而 把 它 分 布 到 几 个 保存 表 段 的 站 点 上 去 运行 就 会 大 大 减少 处 理 时 间 。 又 例如 ， 考 虑 
一 个 处 理 一 所 大 学 中 所 有 学 生 的 姓名 和 平均 成 绩 的 查询 。 如 果 STupENT 表 和 TRANSCRIPT 表 都 保 
存在 中 心 管理 站 点 的 话 ， 那 么 所 有 的 处 理 都 将 在 该 站 点 进行 。 如 果 这 些 表 被 分 段 存储 在 各 校 
区 ， 那 么 每 个 校区 的 数据 库 管理 系统 就 可 以 并 行 执行 并 且 用 较 少 的 时 间 产 生 结 果 。 分 布 的 表 
段 甚至 可 能 改善 系统 吞吐 量 ， 前 提 是 在 一 个 站 点 运行 的 查询 只 访问 本 地 的 表 段 。 分 段 可 以 是 
水 平 或 垂直 的 。 

1. 水 平分 段 

一 个 表 T 被 分 成 若干 段 : 

Ti, To, trey T, 


其 中 每 一 段 包含 T 的 一 部 分 行 并 且 T 的 每 一 行 都 会 出 现在 一 个 段 中 。 例 如 ， 网 络 零售 商 可 能 有 
如 下 关系 : 


INVENTORY (StockNum, Amount, Price, Location) 


用 来 描述 他 的 库存 ， 以 及 存储 库存 的 仓库 地 点 。 该 零售 商 可 以 按 城市 对 此 关系 作 水 平分 


O ”Oracle 实现 的 视图 支持 一 定 程度 的 异 构 性 ， 即 允许 其 他 厂商 的 产品 对 数据 库 进 行 有 限 访 问 。 除 此 之 外 ， 这 
里 描述 的 视图 与 Oracle 提 供 的 视图 类 似 。 
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段 。 例 如 ， 将 所 有 满足 
Location = 'Chicago' . (18.1) 
的 元 组 存储 在 一 个 叫 INvENTORY_CH 并 位 于 芝加哥 的 仓库 的 段 中 ， 其 模式 为 
INVENTORY_CH(StockNum, Amount, Price, Location) 
(Location 属 性 现在 是 多 余 的 了 ， 可 以 被 省 略 。) 因为 每 一 个 元 组 都 被 存放 在 某 段 中 ， 因 此 水 平 
分 段 是 无 损 的 。 可 以 合并 所 有 段 来 重建 表 。 
更 一 般 地 ， 每 一 个 段 都 满足 : 


i T; = oc, (T) 
其 中 Ci 是 选择 条 件 ， 并 且 T 中 的 每 一 个 元 组 对 某 个 ; 值 都 满足 Ci;。 表 达 式 (18.1) 是 选择 条 件 的 
一 个 例子 。 
2.25 98 
一 个 表 T 被 分 成 若干 段 : 
T, Ta T, 
每 一 段 包含 T 的 一 部 分 列 。 每 一 列 必 须 至 少 被 一 个 段 包含 ， 并 且 每 一 段 必须 包含 候选 键 的 列 
(对 所 有 段 都 一 样 )。 


于 是 ， 网 络 零售 商 可 能 有 如 下 的 关系 


EMPLOYEE(SSnum, Name, Salary, Title, Location) 


来 描述 所 有 仓库 的 雇员 。 它 可 能 会 将 EMPLOYEE 关 系 垂直 分 段 为 


EMP1 (SSnum, Name, Salary) 
EMP2 (SSnum, Name, Title, Location) 


其 中 EMP1 存 储 在 总 部 站 点 (职工 工资 在 该 站 点 计算 ) 而 EMP2 存 储 在 别 的 地 方 。 因 为 每 一 列 
至 少 被 一 个 段 包含 ， 且 所 有 的 段 都 含有 同样 的 候选 键 ， 所 以 垂直 分 段 是 无 损 的 。 对 所 有 段 作 
自然 联结 就 可 重建 原来 的 表 。 因 为 每 一 段 都 含有 候选 键 ， 所 以 垂直 分 段 涉 及 复制 。 其 他 列 也 
可 以 被 复制 。 在 上 述 例子 中 ， 两 个 段 中 都 含有 Name 列 ， 因 为 它 在 各 站 点 的 本 地 应 用 中 都 需 
要 用 到 。 

需要 注意 的 是 ， 垂 直 分 段 的 原理 和 我 们 在 第 8 章 中 讨论 的 关系 规范 化 的 原理 是 不 同 的 。 实 
际 上 ， 这 三 个 关系 (EMPLOYEE、EMP1 和 EMP2) 都 是 满足 Boyce-Codd 范 式 的 ， 所 以 第 8 章 提 出 
的 算法 不 适用 于 EMPLOYEE。 

3. 混合 分 段 

同样 可 以 组 合 水 平分 段 和 垂直 分 段 ， 但 是 一 定 要 保证 可 以 从 其 分 段 中 重建 原 表 。 一 种 方 
法 是 先进 行 一 种 分 段 ， 再 进行 另 一 种 分 段 。 于 是 ， 当 网 络 零售 商 将 EMPLoYEE 垂 直 分 段 成 EMP1 
和 EMP2 之 后 ， 他 可 以 按照 地 点 水 平分 段 EMP2。 对 应 芝加哥 和 布 法 罗 仓 库 的 分 段 就 是 


EMP2_CH (SSnum, Name, Title, Location) 
Emp2_Bu (SSnum, Name, Title, Location) 


(再 强调 一 次 ， 属 性 Location 可 以 被 省 略 。) EmP1 被 存放 在 总 部 站 点 ， 而 EMP2_CH 和 EMP2_BU 
被 存放 在 相应 的 仓库 站 点 。 
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4. 导出 的 水 平分 段 

.在 某 些 情况 下 ， 可 能 需要 水 平分 段 一 个 关系 ， 但 决定 哪些 行 属于 哪个 分 段 的 信息 并 不 包 
含 在 这 个 关系 中 。 例 如 假设 网 络 零售 商 在 一 个 城市 有 多 个 仓库 ， 每 个 仓库 用 一 个 编号 来 表示 。 
数据 库 包含 两 个 表 : 


INVENTORY (StockNum, Amount, Price, WarehouseNum) 
WAREHOUSE (WarehouseNum, Capacity, Street-address, Location) 


该 零售 商 在 每 一 个 城市 有 一 个 数据 库 站 点 并 且 想 水 平分 段 INVENTORY 使 某 个 城市 中 的 分 段 
含有 那 座 城市 的 所 有 仓库 中 所 有 货品 的 信息 。 问 题 在 于 ， 指 出 仓库 所 在 城市 的 属性 Location 不 
是 INVENTORY 的 属性 。 所 以 要 如 何 分 割 元 组 就 不 是 很 清楚 。 

为 解决 这 个 问题 ， 我 们 应 该 知道 用 仓库 编号 表示 的 每 个 仓库 的 位 置 。 而 这 些 信 息 保存 在 
WAREHOUSE 表 中 。 因 此 ， 我 们 要 先 联结 这 两 个 表 的 信息 然后 再 做 分 段 。 因 为 仓库 编号 用 同样 
的 属性 名 存放 在 这 两 个 表 中 ， 我 们 可 以 使 用 自然 联结 。INvENTORY 中 描述 芝加哥 的 仓库 的 分 段 
称 为 INVENTORY_CH， 其 中 的 行 是 联结 了 WAREHOUSE 中 的 满足 谓词 Location = 'Chicago' 的 行 。 
于 是 ， 

INVENTORY_CH = XA(INVENTORY pq (OLocation='Chicago' (WAREHOUSE))) 

其 中 A 是 INVENTORY 中 所 有 属性 的 集合 。 这 个 联结 的 作用 仅仅 是 帮助 我 们 找到 要 包含 在 
INVENTORY_CH 中 的 INVENTORY 的 行 。 我 们 并 不 想 保留 WAREHOUSE 中 的 任何 列 ， 因 此 我 们 将 结果 
在 A 中 的 属性 上 作 投 影 。 因 为 

OLocation = ‘Chicago! WAREHOUSE 
是 WAREHOUSE 的 一 个 段 ，INVENTORY 的 分 段 是 从 WAREHOUSE 的 分 段 导 出 的 ， 所 以 我 们 称 这 种 分 
段 为 导出 分 段 (derived fragmentation )。INVENTORY_CH 是 INVENTORY 和 WAREHOUSE 的 一 个 段 的 
FHL (semijoin)。 我 们 将 在 18.3.1 节 讨论 半 联 结 。 

水 平分 段 在 一 个 站 点 的 (大 多 数 ) 应 用 都 只 需要 访问 关系 中 元 组 的 子 集 时 使 用 ; 垂直 分 
段 在 一 个 站 点 的 (大 多 数 ) 应 用 只 需要 访问 关系 中 属性 的 子 集 时 使 用 。 我 们 将 在 18.3 节 讨论 
用 数值 方法 比较 涉及 分 段 的 不 同 数据 库 设 计 。 

基于 全 局 模式 的 体系 结构 可 以 提供 分 段 透 明 性 (fragmentation transparency )。 这 意味 着 
未 分 段 的 原始 关系 出 现在 全 局 模式 中 ， 而 中 间 件 会 将 对 关系 的 访问 转换 成 对 其 在 不 同 数据 库 
中 相应 的 分 段 的 访问 。 相 反 ， 多 数据 库 系统 就 不 能 提供 分 段 透明 性 一 一 每 个 应 用 程序 都 必须 
知道 分 段 并 且 在 查询 中 恰当 地 使 用 它 。 


18.2.2 更 新 和 分 段 


尽管 我 们 的 兴趣 主要 集中 在 查询 上 ， 但 我 们 也 注意 到 ， 当 关系 被 分 段 时 ， 更 新 操作 有 时 
会 要 求 元 组 从 一 个 分 段 移 到 另 一 个 分 段 ， 也 就 是 从 一 个 数据 库 站 点 移 到 另 一 个 数据 库 站 点 。 
假设 那个 网 络 零售 商 的 一 个 雇员 从 芝加哥 仓库 调 到 了 布 法 罗 仓 库 。 在 未 分 段 的 BMPLoYEE 关 系 


EMPLOYEE (SSnum, Name, Salary, Title, Location) 


中 ， 该 员工 的 元 组 中 的 Location 属 性 的 值 必须 加 以 修改 。 如 果 EMPLoYEE 如 前 所 述 被 分 段 成 
EMP2_CH 和 EMP2_Bu 的 话 ， 更 新 该 雇员 的 Location 属 性 要 求 将 相应 的 元 组 从 芝加哥 的 数据 库 移 
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到 布 法 罗 的 数据 库 。 
因此 ， 在 决定 将 数据 放 在 分 布 式 数据 库 的 什么 位 置 时 ， 应 该 考虑 更 新 和 查询 操作 要 求 在 
站 点 间 移 动 数据 的 可 能 性 。 


18.2.3 复制 


复制 是 分 布 式 数据 库 中 最 常用 和 最 有 用 的 机 制 之 一 。 在 几 个 站 点 保存 数据 副本 增加 了 可 
用 性 ， 因 为 即使 有 些 站 点 发 生 故 障 ， 数 据 还 是 可 以 被 访问 。 复制 还 可 以 改善 性 能 ;查询 可 以 
被 更 有 效 地 执行 ， 因 为 可 以 从 本 地 或 附近 的 副本 读 到 数据 。 但是， 更 新 速度 通常 会 变 慢 ， 因 
为 数据 的 所 有 副本 都 需要 更 新 。 因 此 只 有 在 那些 更 新 比 查 询 少 得 多 的 应 用 中 性 能 才 会 因 复制 
得 到 提高 。 在 本 节 中 ， 我 们 将 讨论 和 单个 SQL 语句 执行 相关 的 性 能 问题 。 在 26.7 节 中 我 们 将 进 
一 步 讨 论 访问 包含 副本 数据 的 数据 库 的 事务 性 能 。 

示例 一 : 为 跟踪 其 顾客 ， 网 络 零 售 商 可 能 有 如 下 关系 : 


CUSTOMER(CustNum, Address, Location) 


其 中 Location 表 示 由 一 个 特定 仓库 服务 的 区 域 。 总 部 站 点 的 一 个 每 月 给 所 有 顾客 邮寄 广告 的 应 
用 需要 查询 该 关系 ， 而 每 个 仓库 站 点 查询 该 关系 来 获得 其 所 在 区 域 的 送 货 信 息 。 当 一 个 新 顾 
客 在 该 公司 注册 或 某 一 顾客 的 信息 改变 (这 经 常 发 生 ) 时 ， 该 关系 在 总 部 站 点 更 新 。 直 观 地 
说 ， 按 Location 将 关系 水 平分 段 ， 且 把 特定 的 分 段 存放 在 相应 的 仓库 和 总 部 站 点 ， 这 看 来 很 正 
确 。 于 是 ， 需 要 复制 该 关系 ， 并 在 总 部 站 点 存放 一 个 完整 的 副本 。 我 们 对 此 进行 分 析 ， 并 和 
另外 两 种 不 需要 复制 数据 的 设计 方案 做 一 下 比较 。 这 三 种 设计 方案 是 : 
1 将 整个 关系 存放 在 总 部 站 点 ， 在 仓库 站 点 不 存放 任何 信息 。 
2) 将 所 有 分 段 存 放 在 仓库 站 点 ， 在 总 部 站 点 不 存放 任何 信息 。 
3) 在 两 种 站 点 都 存放 分 段 的 副本 。 
比较 这 些 方 案 的 一 种 方法 是 在 特定 应 用 执行 时 分 别 估计 每 一 种 方案 下 必须 在 站 点 之 间 传 送 的 
信息 量 。 为 了 做 出 比较 ， 我 们 对 于 表 的 大 小 和 各 应 用 执行 的 频 度 做 出 如 下 假设 : 
。CUsTOMER 关 系 大 约 有 100 000 个 元 组 。 | 
“总 部 的 邮寄 广告 应 用 每 月 向 每 一 个 顾客 寄 一 份 广告 。 
。 每 天 需要 大 约 500 次 送 货 服务 (在 所 有 仓库 )， 且 每 一 次 送 货 对 应 一 个 元 组 。 
“公司 每 天 大 约会 增加 100 个 新 的 顾客 相对 而 言 ， 各 个 顾客 信息 的 变化 数目 是 可 以 忽 
略 的 )。 
现在 我 们 可 以 衡量 这 三 WRT. 
1) 如 果 我 们 将 关系 存放 在 总 部 站 点 ， 则 每 当 要 送 货 时 ， 信 息 就 必须 从 总 部 传送 到 相应 的 
仓库 站 点 一 一 大 约 每 天 500 个 元 组 。 | 
2) 如 果 我 们 将 分 段 存放 在 仓库 站 点 ， 信 息 必须 以 如 下 方式 传送 : 
。 当 执行 邮寄 广告 应 用 时 ， 从 仓库 到 总 部 大 约 每 月 传送 100 000 个 元 组 ， 即 每 天 传送 
3300 个 元 组 。 
。 当 一 个 新 顾客 注册 时 ， 从 总 部 到 仓库 大 约 每 天 传送 100 个 元 组 。 
所 以 每 天 一 共 约 需 传送 3400 个 元 组 。 
3) 如 果 我 们 在 仓库 和 总 部 站 点 都 复制 分 段 ， 仅 在 有 新 客户 注册 时 ， 信 息 需 要 从 总 部 传 到 
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仓库 一 一 大 约 每 天 100 个 元 组 。 

从 上 述 比 较 中 可 看 出 ， 复 制 是 最 好 的 方案 。 但 是 ， 其 他 的 问题 也 可 能 很 重要 ， 例 如 事务 
的 响应 时 间 。 

1) 如 果 我 们 将 关系 存放 在 总 部 ， 则 处 理 送 货 的 时 间 很 长 ， 因 为 它 需 要 远程 访问 。 但 这 可 
能 不 会 被 视 为 重要 问题 。 

2) 如 果 我 们 将 分 段 存放 在 仓库 且 每 月 邮寄 广告 是 由 单个 应 用 完成 的 ， 那 么 有 100 000 个 元 
组 必须 从 仓库 传送 到 总 部 。 这 将 会 阻塞 通信 系统 并 且 使 其 他 应 用 的 运行 速度 变 慢 。 可 以 在 其 
他 应 用 较 少 执行 的 周末 的 晚上 运行 该 邮寄 应 用 来 避免 这 个 问题 。 

3) 如 果 我 们 复制 分 段 ， 则 注册 新 顾客 的 时 间 就 比较 长 ， 因 为 需要 更 新 总 部 和 相应 仓库 两 
方面 的 表 中 的 数据 。 这 个 问题 很 重要 ， 因 为 更 新 时 客户 是 在 线 的 ， 而 更 新 时 间 过 长 会 减 慢 整 
个 注册 的 速度 而 变 得 不 可 接受 。 但 是 ， 在 这 个 应 用 中 ， 当 总 部 数据 库 完成 更 新 后 ， 可 以 认为 
与 顾客 的 交互 已 经 完成 了 。 仓 库 站 点 的 更 新 可 以 待 日 后 再 完成 ， 因 为 仅 当 需要 执行 送 货 事务 
时 才 会 需要 那些 信息 。 我 们 将 在 15.3.3 节 和 26.7 节 中 讨论 异步 更 新 复制 (asynchronous-update 
replication ) 。 


我 们 可 以 从 上 述 讨论 中 看 出 ， 复 制 分 段 仍 然 是 最 好 的 方案 。 


18.3 查询 策略 


多 数据 库 系 统 由 一 组 互相 独立 的 DBMS 组 成 。 在 一 种 多 数据 库 系统 中 ， 每 个 DBMS 对 应 用 
都 有 一 个 SQL 接口 。 为 了 查询 储存 在 多 个 站 点 的 信息 ， 必 须 把 查询 分 解 为 一 系列 SQL 语句 ， 
每 一 条 语句 都 由 特定 的 DBMS 来 处 理 。 当 接收 到 一 条 SQL 语句 后 ， 该 站 点 的 查询 优化 器 就 会 
产生 一 个 查询 执行 计划 ， 热 行 语句 ， 将 结果 返回 到 这 个 应 用 。 

支持 全 局 模式 的 系统 含有 一 个 全 局 查询 优化 器 ， 它 用 全 局 模式 分 析 查 询 并 将 其 翻译 成 一 
系列 在 单个 站 点 执行 的 步骤 。 每 一 个 步骤 又 可 在 相应 站 点 进一步 用 本 地 查询 优化 器 优化 并 执 
行 。 因 此 ， 全 局 查询 处 理 涉及 一 个 分 布 式 算法 ， 分 布 式 算法 又 涉及 DBMS 之 间 的 直接 数据 交 
换 。 结 果 ，DBMS 除 了 对 应 用 有 一 个 SQL 接 口 ， 还 要 有 一 个 支持 与 其 他 DBMS 间 数据 交换 的 
接口 。 

在 这 两 种 情况 下 ， 我 们 感 兴趣 的 都 是 如 何 更 有 效 地 执行 查询 。 由 于 输入 输出 的 代价 远大 
于 计算 的 代价 ， 所 以 我 们 在 第 13 章 中 衡量 查询 执行 计划 的 效率 的 方法 是 估计 所 要 求 的 输入 输 
出 操作 的 次 数 。 同 样 的 道理 ， 衡 量 分 布 式 数据 库 查 询 的 代价 基于 所 需要 的 通信 代价 ， 因 为 通 
盲 是 昂贵 而 费时 的 。 

我 们 对 查询 优化 的 兴趣 在 三 个 方面 。 熟 悉 全 局 查询 优化 算法 可 以 帮助 我 们 设计 : 

* 全 局 查询 ， 能 够 在 包含 全 局 查询 优化 器 的 系统 中 有 效 地 执行 。 

* 全 局 查询 ， 能 够 在 不 包含 全 局 查询 优化 器 的 多 数据 库 系统 中 有 效 地 执行 ( 见 18.3.2 节 )。 

“分 布 式 数据 库 ， 使 全 局 查询 可 以 在 其 上 有 效 地 执行 ( 见 18.3.3 节 )。 


18.3.1 全 局 查询 优化 


1. 联结 的 计划 
涉及 不 同 站 点 的 表 联 结 (全 局 联结 ) 的 查询 其 代价 是 尤其 昂贵 的 ， 因 为 必须 在 站 点 间 传 
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送信 息 来 决定 结果 中 的 元 组 。 例 如 ，A 站 点 的 一 个 应 用 要 联结 站 点 B 和 C 的 两 个 表 ， 并 把 结果 
传 回 A 站 点 。 可 用 全 局 优化 器 来 评估 的 两 个 执行 该 联结 的 直观 方法 是 : 
1) 把 两 个 表 都 传 到 A 站 点 ， 然 后 在 那里 执行 联结 。A 站 点 的 应 用 程序 就 可 以 显 式 地 测试 联 
结 条 件 。 这 是 在 不 支持 全 局 联结 的 多 数据 库 系 统 中 使 用 的 方法 。 
2) 把 较 小 的 表 (例如 B 站 点 的 表 ) 传 到 C 站 点 ， 在 C 站 点 执行 联结 ， 然 后 将 结果 传 到 A 
为 了 更 详细 地 说 明 ， 我 们 考虑 两 个 表 STUDENT (Id, Major) 和 TRANSCRIPT (StudId, CrsCode), 
其 中 STUDENT 记 录 了 每 个 学 生 的 专业 ，TRANSCRIPT 表 记录 了 学 生 在 本 学 期 选修 的 课程 。 这 两 个 
表 分 别 存放 在 B 站 点 和 C 站 点 。 假 设 A 站 点 的 应 用 要 计算 等 值 联结 ， 其 联结 条 件 为 
| Id = StudId (18.2) 
为 了 比较 这 两 种 查询 计划 ， 我 们 必须 对 表 的 大 小 和 ( 某 些 情况 下 ) 对 这 些 表 所 进行 的 操 
作 的 相对 频 度 做 出 一 些 假设 。 对 于 本 例 ， 我 们 假设 
。 属 性 的 长 度 是 : 
。Id 和 StudId: 9 个 字 节 。 
e Major: 3 个 字 节 。 
。CrsCode: 6 个 字 节 。 
。STUDENT 大 约 有 15 000 个 元 组 ， 每 个 元 组 的 长 度 是 12 个 字 节 (9+3). 
*。 大 约 有 5000 个 学 生 至 少 选 修了 一 门 课 程 ， 且 平均 每 个 学 生 选 修 4 门 课 。 因 此 ， 
TRANSCRIPT 大 约 有 20 000 个 元 组 ， 每 个 元 组 的 长 度 是 15 个 字 节 (9+6)。 注 意 ， 有 10 000 
个 学 生 没有 选修 任何 课程 。 
联结 的 结果 中 有 大 约 20 000 个 元 组 (TRANSCRIPT 中 的 每 一 个 元 组 对 应 联结 结果 中 的 一 个 元 
组 )， 每 个 元 组 的 长 度 是 18 个 字 节 (9+3+6)。 

基于 这 些 假设 ， 我 们 比较 以 上 的 查询 策略 。 

1) 如 果 把 两 个 表 都 送 到 A 站 点 来 做 联结 ， 我 们 要 传送 480 000 个 字 节 ( 即 15 000x12 + 
20 000 x 15)。 

2) 如 果 把 STUDENT 表 送 到 C 站 点 ， 在 那里 计算 联结 ， 然 后 把 结果 送 到 A 站 点 ， 我 们 需要 传 
送 540 000 个 字 节 ( 即 15 000 x 12 + 20 000 x 18)。 

3) 如 果 把 TRANSCRIPT 表 送 到 B 站 点 ， 在 那里 计算 联结 ， 然 后 把 结果 送 到 A 站 点 ， 我 们 需要 
传送 660 000 个 字 节 〈 即 20 000 x 15 + 20 000 x 18). 

于 是 ,我们 可 以 看 出 最 好 的 策略 是 1。 

2. 半 联 结 的 计划 o 

全 局 查询 优化 器 可 能 考虑 的 另 一 个 更 为 有 效 的 方法 是 只 将 STUDENT 表 中 那些 将 会 实际 参与 

联结 的 元 组 从 B 站 点 传 到 C 站 点 ， 然 后 在 C 站 点 对 这 些 元 组 和 TRANSCRIPT 表 做 联结 。 这 个 方法 
涉及 被 称 为 半 联 结 (semijoin) 的 操作 。 这 个 过 程 由 三 个 步骤 组 成 。 

1) 在 C 站 点 ， 计 算 表 P。P 是 TRANSCRIPT 表 在 StudId 上 的 投影 ， 即 在 联结 条 件 中 将 会 涉及 到 

的 列 ， 并 把 P 送 到 B 站 点 。 于 是 ，P 中 包含 那些 目前 至 少 选 修一 门 课 的 学 生 的 Id。 
2) 在 B 站 点 ， 根 据 联结 条 件 (18.2) 对 STupENT 表 和 了 P 做 联结 ， 并 把 结果 表 Q 送 到 C 站 点 。Q 中 
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包含 了 STUDENT 表 中 所 有 参与 联结 的 元 组 。 在 本 例 中 ，Q 包 含 了 对 应 于 STUDENT 表 中 所 有 至 少 
选修 了 一 门 课 的 学 生 的 元 组 。 

3) 在 C 站 点 ， 根 据 联 结 条 件 对 TRANScRIPT 表 和 Q 做 联结 。 然 SSroner 胡 和 TaANscmtr 
表 的 联结 结果 送 回 A 站 点 。 

步骤 2 的 结果 关系 Q 被 称 为 SrupENT 表 和 TRANSsCRipT 表 的 半 联 结 。 更 普遍 地 ， 两 个 关系 Ti 和 
T; 的 半 联 结 (是 基于 一 个 联接 条 件 的 ) 被 定义 为 Ti 和 T: 的 联结 在 Ti 的 列 上 的 投影 : 


Nattributes(T,) (T1 D< join-condition T2) 

换言之 ， 半 联结 是 由 Ti 中 参与 与 T: 的 联结 的 元 组 组 成 的 。 于 是 就 可 想到 为 计算 式 子 
Ty PSjoin-condition T2 
可 先 计算 半 联结 ， 然 后 再 和 Ts 联 结 : 
(Nattributes(T1) (T1 D< join-condition T2)) P< join-condition T2 
以 上 两 式 相等 的 证 明 留 作 练习 18.10。 1 
看 起 来 我 们 似乎 是 倒退 了 一 步 ， 用 两 个 联结 来 代替 一 个 联结 。 然 而 ， 步 又 1 为 我 们 提供 了 

这 样 的 线索 ， 即 执行 半 联 结 溢 在 的 经 济 性 与 下 面 的 等 式 有 关 : 


attributes (T1) (Ti D< join-condition T) 


= Wattributes (T4) (attributes join-condition) (T2) P< join-condition T1) 


换 甸 话说 ， 为 计算 T, 和 Ts 的 半 联 结 ， 我 们 可 以 先 在 联结 条 件 中 的 属性 上 对 T, 做 投影 ， 然 后 
将 结果 与 T! 联 结 (用 相同 的 联结 条 件 )。 我 们 将 这 个 等 式 的 证 明 留 作 练习 18.9。 第 一 步 玉 在 地 
减少 了 通信 代价 ， 因 为 T: 的 投影 要 比 T 小 得 多 ， 所 以 我 们 就 可 以 避免 在 通信 链 路 上 传送 大 量 
数据 。 但是， 我 们 也 必须 为 额外 的 对 半 联 结 结果 和 T: 的 联结 付出 代价 。 如 果 在 通信 上 节省 的 
代价 超过 了 额外 联结 的 代价 ， 则 我 们 还 是 成 功 的 。 

在 我 们 的 例子 中 ， 计 算 的 三 个 步骤 对 应 于 下 列 的 代数 表达 式 : 


Tattributes (STUDENT) (Tattributes (join-condition) (TRANSCRIPT) 
bd join-condition STUDENT) 
D< join-condition TRANSCRIPT 


根据 我 们 上 述 的 讨论 ， 上 式 等 价 于 计算 STUpENT 表 和 TRANSCRIPT 表 的 联结 。 

将 这 个 方法 与 之 前 的 儿 个 方法 比较 是 很 有 启发 的 。 

1) 在 第 一 步 ， 我 们 传送 了 45 000 个 字 节 (HS 000 x 9), 

2) 在 第 二 步 ， 我 们 传送 了 60 000 个 字 节 ( 即 5 000 x 12). 

3) 在 第 三 步 ， 我 们 传送 了 360 000 个 字 节 (E120 000 x 18). 

因此 我 们 总 共 传 送 了 465 000 个 字 节 〈 即 45 000 + 60 000 + 360 000)。 所 以 ， 就 通信 代价 
而 言 ， 半 联结 的 方法 比 我 们 之 前 讨论 过 的 方法 都 要 好 。 

3. 用 复制 实现 全 局 联结 

还 有 另 一 种 实现 全 局 联结 的 方法 是 ， 在 另 一 个 站 点 保存 此 站 点 的 表 的 副本 ， 于 是 把 全 局 
联结 转化 为 本 地 联结 。 在 这 个 例子 中 ， 我 们 可 以 在 C 站 点 中 保存 一 个 STupENT 表 的 副本 ， 在 C 
站 点 与 TRANSCRIPT 表 做 联结 ， 然 后 返回 360 000 字 节 的 结果 到 A 站 点 。 
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这 个 方法 加 快 了 联结 操作 的 速度 ， 但 是 减 慢 了 被 复制 的 表 的 更 新 操作 的 速度 。 在 这 个 例 
子 中 ， 更 新 可 能 很 少 发 生 ， 因 为 很 少 有 学 生 会 改变 他 们 的 专业 。 

4. 涉及 联结 和 投影 的 查询 

大 多 数 的 查询 不 仅 涉及 联结 ， 还 包含 其 他 的 关系 操作 符 。 在 上 述 例子 中 ， 假 设 A 站 点 的 一 
个 应 用 执行 一 个 查询 ， 该 查询 要 求 返 回 所 有 至 少 选修 一 门 课程 的 学 生 的 专业 和 课程 代码 。 于 
是 ， 如 果 至 少 有 一 个 计算 机 系 (CS) 的 学 生 选 修了 CS305， 那 么 行 (CS, CS305) 就 会 在 结果 表 中 。 
该 查询 先 对 两 个 表 STUDENT 和 TRANSCRIPT 做 联结 ， 然 后 在 Major 和 CrsCode 上 投影 来 得 到 结果 表 
R。 我 们 的 计划 是 在 做 联结 的 站 点 执行 投影 操作 ， 然 后 将 结果 R 送 到 A 站 点 。 

为 重新 衡量 上 一 节 提 出 的 四 个 策略 的 通信 代价 ， 需 要 多 加 一 个 假设 ， 即 R 有 1000 个 元 组 。 
每 个 元 组 的 长 度 是 9 个 字 节 ， 因 此 R 的 大 小 是 9000 字 节 ， 比 联结 后 的 表 要 小 得 多 。 这 在 实际 查 
询 中 是 很 常见 的 。 

1) 如 果 把 所 有 的 表 都 送 到 A 站 点 并 在 那里 完成 所 有 的 操作 ， 那 么 需要 传送 480 000 个 字 节 ， 
同 前 面 一 样 。 

2) 如 果 把 STUDENT 表 送 到 C 站 点 ， 在 那里 执行 操作 ， 然 后 把 R 送 回 A 站 点 ， 那 么 需要 传送 
189 000 个 字 节 ( 即 15 000 x 12 + 1000 x 9), 

3) 如 果 把 TRANSCRIPT 表 送 到 B 站 点 ， 在 那里 执行 操作 ， 然 后 把 R 送 回 A 站 点 ， 那 么 需要 传 
送 309 000 个 字 节 (B20 000 x 15 + 1000 x9)。 

4) 如 果 如 前 面 所 述 做 半 联 结 ， 在 C 站 点 做 投影 ， 然 后 把 R 送 回 A 站 点 ， 那 么 需要 传送 
114 000 个 字 节 ( 即 5000 x 9 + 5000 x 12 + 1000 x 9), 

所 以 ， 半 联结 的 方法 仍然 是 最 好 的 选择 。 

可 以 修改 第 二 步 再 对 过 程 加 以 优化 。 在 执行 完 半 联结 得 到 Q 之 后 ， 对 Q 做 投影 只 保留 查询 
中 需要 的 SrupENT 表 的 列 。 只 将 这 些 列 从 B 站 点 传送 到 C 站 点 。 例 如 ， 假 设 SrupENT 表 还 有 其 他 
的 一 些 属性 (如 Address、Date_of_Birth、Entrance_date ) ， 并 且 查 询 还 是 像 以 前 一 样 要 求 对 学 
生 选 修 的 每 一 门 课 找到 相应 的 It、CrsCode 和 Major。 那 么 在 第 二 步 ， 就 可 以 在 WHERE 和 
SELECT 语句 中 提 到 的 这 些 属 性 上 作 投 影 ， 并 只 把 这 些 属性 送 到 C 站 点 。 

这 个 想法 可 以 运用 到 之 前 讨论 过 的 所 有 方案 中 。 在 把 一 个 表 送 到 另 一 个 站 点 进行 联结 之 
前 ， 所 有 不 需要 的 属性 都 可 以 被 省 略 掉 。 l 

5. 涉及 联结 和 选择 的 查询 

类 似 的 想法 也 可 以 用 在 涉及 联结 和 选择 的 查询 中 。 例 如 ， 假 设 在 网 络 零售 商 的 应 用 中 只 
有 一 个 仓库 ， 且 EMPLOYEE 关 系 被 垂直 分 段 成 


EMP1 (SSnum, Name, Salary) (183 
_Emp2 (SSnum, Title, Location) 3) 


这 些 关 系 分 别 存放 在 B 站 点 〈 总 部 ) 和 C 站 点 〈 仓 库 )。 假 设 在 第 三 个 站 点 A 有 一 个 应 用 ， 要 查 
HAA Rik E820 000 以 上 的 经 理 的 名 字 。( 如 果 我 们 假设 有 多 个 仓库 ， 其 原理 是 相似 的 ， 只 
是 计算 上 复杂 一 点 儿 ， 见 练习 18.14)。 

一 个 比较 直观 的 方法 是 先 将 两 个 表 联 结 起 来 (重新 产生 EMPLOYEE 表 ) 然后 利用 选择 和 投 
影 操 作 来 获得 : 


TUNAME (OTitte='manager' AND Salary>'20000' (EMP1 D< EMP2)) 
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但 是 ， 用 半 联 结 的 方法 来 优化 联结 不 会 降低 通信 代价 。 这 是 因为 ， 这 两 个 表 都 是 EMPLoYEE 表 
的 垂直 分 段 ， 所 以 EMP1 和 EMP2 都 包含 了 EMpPLoYEE 的 一 个 键 SSnum。 因 此 每 个 表 中 的 所 有 元 组 
都 必须 参与 重建 EMPLOYEE。 
但 是 ， 我们 注意 到 选择 条 件 可 以 被 分 割 为 单个 表 上 的 选择 条 件 。 
。 在 EMP1 上 的 选择 条 件 是 Salary > '20000'。 
。 在 EMP2 上 的 选择 条 件 是 Title = '"Manager'。 
现在 可 以 用 关系 运算 符 的 数学 性 质 来 改变 联结 和 选择 操作 的 顺序 (回想 14.2 节 中 选择 的 级 联 
和 递 推 规则 小 
TINAME〈(Gsalary>20000 EMP1) D< (grne-manager EMP2)) 
详细 地 说 ， 
1) 在 B 站 点 ， 从 EMP1 中 选择 所 有 工资 大 于 $20 000 的 元 组 ， 结 果 称 为 Ri。 
2) 在 C 站 点 ， 从 EMP2 中 选择 所 有 职位 是 经 理 的 元 组 ， 称 结果 为 R,。 
3) 在 某 个 站 点 ( 由 后 面 的 规则 决定 ) 执行 Ri 和 R: 的 联结 并 把 结果 在 Name 属 性 上 投影 。 称 
结果 为 R;。 如 果 这 个 站 点 不 是 站 点 A， 那 么 把 结果 Rs 送 到 A 站 点 。 
余下 的 唯一 问题 就 是 ， 在 哪里 执行 第 三 步 中 的 联结 。 有 三 种 可 能 : 
1) 计划 1: 把 Rs 送 到 B 站 点 ， 并 在 那里 做 联结 。 然 后 把 姓名 送 到 A 站 点 。 
2) 计划 2: 把 Ri 送 到 C 站 点 ， 并 在 那里 做 联结 。 然 后 把 姓名 送 到 A 站 点 。 
3) 计划 3: 把 Ri 和 R: 送 到 A 站 点 ， 并 在 那里 做 联结 。 
像 从 前 一 样 ， 为 了 决定 哪个 是 最 好 的 方案 ， 必 须 考虑 不 同 的 表 的 大 小 和 结果 的 大 小 。 我 . 
们 做 出 如 下 假设 : 
。 属 性 的 长 度 为 : 
。SSnum: 9 个 字 节 。 
。Salary: 6 个 字 节 。 
。Title: 7 个 字 节 。 
。Location: 10 个 字 节 。 
‘e Name: 15 个 字 节 。 , 
因此 ，EMP1 中 的 每 个 元 组 长 度 是 30 个 字 节 ， 而 EMP2 中 的 每 个 元 组 长 度 是 26 个 字 节 。 
。EMP1 (和 EMP2) 有 大 约 100 000 个 元 组 。 
“大 约 有 5 000 名 雇员 的 薪水 超过 $20 000。 因 此 ，Ri 大 约 有 5000 个 元 组 (每 个 元 组 的 长 度 
为 30 字 节 )， 共 有 150 000 个 字 节 。 
° 有 大 约 50 名 经 理 。 因 此 ，R2 有 大 约 50 个 元 组 〈 每 个 元 组 的 长 度 为 26 字 节 )， 共 有 1300 个 
字 节 。 
“大约 90% 的 经 理 薪水 超过 $20 000。 因 此 ，Rs 有 大 约 45 个 元 组 ， 每 个 元 组 长 度 为 15 个 字 
节 ， 共 有 675 个 字 节 。 
现在 可 以 估计 每 个 计划 的 代价 了 。 
1) 如 果 在 B 站 点 做 联结 ， 需 要 从 C 站 点 传送 1300 个 字 节 到 B 站 点 ， 还 要 从 B 站 点 传 675 个 字 
节 到 A 站 点 ， 共 传送 1975 个 字 节 。 
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2) 如 果 在 C 站 点 做 联结 ， 需 要 从 B 站 点 传送 150 000 个 字 节 到 C 站 点 ， 还 要 从 C 站 点 传 675 个 
字 节 到 A 站 点 ， 共 传送 150 675 个 字 节 。 

3) 如 果 在 A 站 点 做 联结 ， 需要 从 了 所 传送 150 000 个 字 HHL AR 还 要 从 C 站 点 传送 
1300 个 字 节 到 A 站 点 ， 共 传送 151 300 个 字 

正如 你 所 见 的 ， 第 一 个 计划 要 远 远 好 于 另外 两 个 计划 
为 充分 理解 设计 良好 的 查询 计划 的 重要 性 ， 将 这 个 计划 的 代价 与 未 优化 的 计划 的 代价 作 比 较 。 
在 未 优化 的 策略 中 ，EMP1 和 EMP2 被 传送 到 A 站 点 ， 在 那里 评估 查询 。 那 样 的 话 ， 需 要 传送 
5 600 000 个 字 节 ( 即 2 600 000 + 3 000 000) ! 


18.3.2 多 数据 库 系 统 的 策略 


访问 多 数据 库 系 统 的 应 用 不 能 在 全 局 模式 上 提交 SQL 语句 。 涉 及 多 个 站 点 数据 的 查询 必 
须 用 一 组 SQL 语句 构造 ， 每 一 个 语句 根据 特定 的 DBMS 的 模式 来 构造 并 在 该 站 点 处 理 。 尽 管 
这 样 的 环境 不 存在 全 局 查询 优化 器 ， 但 是 应 用 设计 者 可 以 参考 在 18.3.1 节 讨论 的 一 些 想法 来 选 
择 实现 查询 的 合适 的 语句 序列 。 遗 憾 的 是 ， 设 计 者 在 两 个 重要 的 方面 受到 限制 。 我 们 用 网 络 
零售 商 的 例子 来 说 明 。 

1) 在 一 个 多 数据 库 系 统 中 ， 数 据 只 能 在 数据 库 站 点 和 提交 查询 的 站 点 (在 本 例 中 是 A 站 
点 ) 间 通 信 。 男 一 方面 ， 利 用 全 局 查询 优化 器 ， 数 据 库 站 点 互相 合作 并 且 直 接 通信 。 

2) 即使 数据 不 能 在 数据 库 站 点 之 问 直接 传送 ， 我 们 还 可 以 考虑 将 数据 通过 A 站 点 间接 地 
从 一 个 站 点 传送 到 另 一 个 站 点 。 但 这 个 方法 是 不 可 能 的 。 尽 管 A 站 点 可 以 从 DBMS 接 收 数据 
(作为 提交 SELECT 语句 的 结果 )， 但 它 不 能 向 DBMS 送 出 数据 ， 因 为 应 用 的 接口 只 关心 处 理 
SQL 语句 (而 不 是 接收 数据 )。 

这 使 得 它 从 本 质 上 不 可 能 去 模仿 半 联 结 方法 的 第 一 步 ， 即 传送 一 个 表 的 投影 (在 该 步骤 
中 是 P) ©, 

示例 ”重新 考虑 前 一 节 中 被 分 段 的 表 EMPLOYEE， 以 及 在 A 站 点 提交 的 请 求 所 有 工资 大 于 
$20 000 的 经 理 的 姓名 的 查询 。 ROE RD RER ARIS, RNA 
望 优化 器 选择 计划 1， 其 通信 代价 只 有 1975 字 

如 果 同样 的 查询 在 一 个 多 数据 库 系 统 让 执行 则 应 用 设计 者 可 先 在 每 个 站 点 执行 SELECT 
语句 ， 返 回 Ri 和 Ra2: 到 A 站 点 。 然 后 程序 会 在 这 些 元 组 上 执行 必要 的 处 理 来 实现 联结 操作 。 其 通 
信 代 价 和 计划 3 相同 ， 都 是 151 300 字 节 。 虽 然 这 个 策略 不 如 全 局 查询 优化 器 可 选择 的 最 佳 策 
略 那么 有 效率 ， 但 它 比 把 EMP1 和 EMP2 整 个 传送 到 A 站 点 ， 花 费 5 500 000 字 节 代 价 的 原始 策略 
要 好 得 多 了 。 


18.3.3 调整 问题 ; 分 布 式 环境 下 的 数据 库 设计 和 查询 计划 
和 集中 式 的 情况 一 样 ， 分 布 式 数据 库 的 查询 计划 也 涉及 评估 选择 方案 ， 其 中 有 : 


日 A 站 点 可 能 会 通过 动态 构造 一 个 基于 P 中 的 行 的 SELECT 语句 试 着 绕 开 这 个 限制 。 例 如 ， 如 果 P 有 一 个 属性 
attr， 且 其 列 值 为 a, b…， 那 么 WHERE 语句 可 能 含有 式 子 (attr = 'a' OR attr='b' OR…)。 注 意 ， 投 影 xom(P) 被 
编码 到 该 查询 中 的 WHERE 语句 中 。 于 是 ， 向 远程 站 点 发 送 这 个 查询 就 等 价 于 A 发 送 raw(P) 到 该 站 点 。 于 是 ， 
A 站 点 收 到 查询 结果 就 等 价 于 从 该 远程 站 点 收 到 半 联 结 的 结果 。 遗憾 的 是 ， 这 个 方法 只 适用 于 attr 值 域 很 小 
的 情况 。 
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。 在 不 同 的 站 点 执行 操作 。 

。 在 查询 执行 时 将 部 分 结果 或 整个 表 从 一 个 站 点 传送 到 另 一 个 站 点 。 

。 执 行 半 联 结 

“使 用 关系 代数 的 启发 式 优化 规则 (参见 14.2 节 ) 对 操作 重新 排序 

应 用 设计 者 不 能 控制 全 局 查询 优化 器 使 用 的 策略 。 但 设计 者 可 以 控制 分 布 式 数据 库 的 设 
计 ， 而 设计 可 以 改变 全 局 查询 优化 器 可 选择 的 方案 ， 从 而 在 很 大 程度 上 影响 查询 策略 。 这 对 
于 应 用 设计 者 手工 完成 多 数据 库 系 统 的 查询 计划 也 成 立 。 

在 集中 式 的 情况 下 ， 应 用 设计 者 可 能 通过 加 入 索引 或 反 规范 化 表 ( 见 8.13 节 、13.7 节 和 
14.6 节 ) 来 改变 数据 库 的 模式 。 在 分 布 式 的 情况 下 ， 设 计 者 可 能 有 更 多 的 选择 ， 例 如 : 

。 把 表 放 在 不 同 的 站 点 。 

* 用 不 同 的 方法 将 表 分 段 ， 然 后 把 分 段 放 在 不 同 的 站 点 。 

。 复 制 表 或 表 中 的 数据 (例如 ， 反 规范 化 的 )， 并 把 副本 放 在 不 同 的 站 点 。 

和 在 集中 式 数 据 库 中 一 样 ， 这 些 选 择 可 能 会 加 快 一 些 操作 的 速度 ， 同 时 减 慢 另 一 些 操作 
的 速度 。 因 此 ， 设 计 者 在 衡量 一 个 数据 库 设计 时 要 考虑 应 用 中 各 操作 的 相对 频 度 以 及 该 操作 
的 吞吐 量 和 响应 时 间 的 重要 程度 。 

在 网 络 零售 商 的 应 用 中 ， 将 INVENTORY 关 系 分 段 加 快 了 处 理 送 货 的 本 地 应 用 的 速度 ， 但 也 
减 慢 了 需要 联结 分 段 的 金 局 应 用 (例如 ， 计 算 公司 总 的 库存 的 速度 。 在 权衡 这 些 选择 方案 时 ， 
公司 可 能 要 求 送 货 应 用 必须 执 得 很 快 ， 而 计算 总 库存 的 应 用 不 会 经 常 执行 ， 而 且 对 其 响应 
时 间 也 没有 很 高 的 要 求 。 

应 用 设计 者 可 能 会 考虑 在 总 部 数据 库 中 复制 仓库 库存 信息 来 加 快 全 局 库存 应 用 的 速度 。 
但 这 个 方案 很 可 能 被 拒绝 ， 因 为 仓库 存货 的 库存 信息 总 是 更 新 得 很 快 ( 每 一 次 送 货 时 都 要 更 
新 )， 而 且 为 更 新 副本 花费 的 通信 代价 远 远大 于 执行 全 局 库存 应 用 的 代价 。 权 衡 这 些 利弊 对 于 
设计 一 个 高 效 运行 且 满 足 公司 需 求 的 应 用 是 很 重要 的 。 


18.4 参考 书目 


我 们 关于 分 布 式 查询 处 理 的 描述 基于 两 个 系统 的 实现 ， 即 SDD-1[Wong 1977, Bernstein et al. 1981] 
和 System R*[Griffiths-Selinger and Adiba 1980]。 半 联结 的 理论 在 [Bernstein and Chiu 1981] 中 讨论 。 
[Chang and Cheng 1980, Ceri et al. 1982] 中 讨论 了 分 段 。 更 深入 的 关于 分 布 式 数据 库 问 题 的 研究 (特别 
是 数据 库 设计 和 查询 处 理 ) 可 以 在 一 些 专业 的 文献 中 找到 ， 例 如 [Ceri and Pelagatti 1984, Bell and 
Grimson 1992] 和 [Ozsu and Valduriez 1991]。 . 


18.5 练习 


18.1 讨论 应 用 设计 者 把 应 用 设计 为 同 构 系 统 的 好 处 ， 即 所 有 的 数据 库 由 同一 个 厂商 提供 。 

18.2 解释 为 什么 一 个 表 可 以 按照 集中 式 系统 的 模式 来 分 段 。 

18.3 解释 下 列 说 法 正确 与 否 : 通过 对 表 T 做 分 段 (垂直 或 水 平 ) 得 到 的 两 个 表 ， 其 联结 不 可 能 包含 T 以 
外 的 元 组 。 

184 考虑 18.3.2 节 给 出 的 两 个 多 数据 库 系 统 中 查询 设计 的 例子 。 用 Java 和 JDBC 编 写 程序 实现 它们 。 

18.5 A 站 点 的 一 个 程序 要 求 联结 分 别 在 B 站 点 和 C 站 点 的 两 个 表 ， 写 出 该 程序 。 陈 述 使 以 下 结论 成 立 的 
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18.8 
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18.10 


18.11 


18.12 
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假设 条 件 : 只 考虑 通信 代价 ， 那 么 最 好 的 实现 方法 是 将 B 站 点 的 表 送 到 C 站 点 ， 在 那里 做 联结 ， 然 
后 把 结果 送 到 A 站 点 。 

你 正在 考虑 按 Location 水 平分 段 如 下 关系 : 

EMPLOYEE (SSN, Name, Salary, Title, Location) 

并 把 每 个 分 段 存放 在 那个 地 点 的 数据 库 中 ， 同 时 可 以 在 别 的 站 点 复制 一 部 分 分 段 。 讨 论 可 能 会 影 
响 你 的 决定 的 查询 类 型 和 更 新 (以 及 它们 的 频 度 )。 

假设 有 如 下 关系 


EMPLOYEE2 (SSnum, Name, Salary, Age, Title, Location) 


把 它 分 段 成 

EMP21 (SSnum, Name, Salary) . 

EMP22 (SSnum, Title, Age, Location) 

其 中 EMP21 存 放 在 B 站 点 ， 而 EMP22 存 放 在 C 站 点 。A 站 点 的 一 个 查询 要 求 找 出 会 计 部 门 中 薪水 大 
于 他 们 的 年 龄 的 所 有 经 理 的 姓名 。 使 用 18.3.1 节 对 表 和 属性 大 小 的 假设 ,: 为 这 个 查询 设计 一 个 计 
划 。 假 设 Age 列 的 数据 长 度 为 2 个 字 节 。 
设计 一 个 多 数据 库 查 询 计划 和 一 组 SQL 语句 来 实现 上 题 中 的 查询 。 
用 关系 代数 来 证 明 18.3.1 节 中 用 半 联 结 来 实现 联结 的 方法 的 第 2 步 确 实 产生 一 个 半 联 结 。 为 简明 起 
见 ， 假 设 我 们 要 做 的 联结 是 自然 联结 。 即 证 明 

Wattributes(T1) (T D< T2) = Manributestr ) Tantriburestjoin-condition) (T1) >< T2) 
用 关系 代数 来 证 明 18.3.1 节 中 用 半 联 结 来 实现 联结 的 方法 的 第 3 步 确实 产生 一 个 联结 .为 简明 起 见 ， 
假设 我 们 要 做 的 联结 是 自然 联结 。 即 证 明 
attributes(T) (TI D< T2) D< T, = (T, D< T2) 


为 18.3.1 节 中 联结 的 例子 设计 一 个 查询 计划 ， 假 设 表 的 大 小 和 该 节 中 表 的 一 样 ， 但 有 如 下 的 区 别 : 
a. B 站 点 的 一 个 应 用 请 求 联结 。 

b. C 站 点 的 一 个 应 用 请 求 联结 。 

用 关系 代数 证 明 18.2.1 节 中 设计 水 平分 段 的 方法 的 正确 性 。 

证 明 半 联结 操作 是 不 可 交换 的 ， 即 了 T 半 联结 T, 和 Ts 半 联结 T 是 不 同 的 。 . 

用 式 (18.3) 的 模式 来 设计 找到 所 有 工资 大 于 $20 000 的 经 理 (Title = "manager 的 雇员 ) 的 姓名 ， 但 
是 假设 有 三 个 仓库 。 同 时 假设 雇员 总 数 约 为 100 000 人 ， 其 中 5 000 人 的 工资 在 $20 000 以 上 ， 经 理 


”的 总 人 数 是 50， 且 其 中 90% 的 人 工资 在 $20 000 以 上 。 





第 19 章 OLAP 和 数据 挖掘 


本 章 介绍 了 OLAP (联机 分 析 处 理 )、 数 据 仓库 和 数据 挖掘 这 些 新 兴 领 域 的 概念 和 技术 。 
OLAP 的 相关 内 容 可 参考 [Chaudhuri and Dayal 1997]。 数 据 挖掘 较 之 OLAP 包 含 了 更 多 的 内 容 ， 
涉及 数据 库 、 统 计 分 析 和 机 器 学 习 。 通 过 本 章 的 介绍 ， 读 者 可 以 对 这 些 知 识 有 大 致 的 了 解 。 
如 果 想 进行 深入 学 习 相关 内 容 ， 请 参考 介绍 这 一 领域 最 新 应 用 和 研究 的 论文 集 [Fayyad et al. 
1996] 和 [Han an Kamber 2001]。 


19.1 OLAP 和 数据 仓库 


因特网 上 为 什么 会 有 那 
事实 上 ， 不 会 有 真正 的 免费 午餐 ， 你 付出 的 是 你 的 个 人 信息 ， 而 且 ， 当 你 在 因特网 上 购物 的 
时 候 ， 你 还 提供 了 更 多 的 个 人 信息 ， 即 你 的 购买 习惯 。 

当 你 在 超市 和 其 他 商场 用 信用 卡 购物 的 时 候 ， 你 也 同样 提供 了 个 人 信息 。 在 这 些 情况 下 ， 
你 的 个 人 信息 被 存储 到 了 事务 处 理 系统 (transaction processing system) 中 ， 系 统 将 来 会 用 这 
些 数 据 进行 分 析 。 | 

你 不 禁 要 问 ， 存 储 这 些 信 息 有 什么 用 呢 ? 一 般 来 说 ， 这 些 信息 会 与 从 其 他 途径 得 到 的 关 
于 你 的 信息 汇总 起 来 ， 存 储 到 数据 库 中 。 使 用 这 些 信息 的 方式 有 以 下 几 种 : 

。 一 些 企业 把 能 搜集 到 的 所 有 用 户 的 信息 和 他 们 的 购买 情况 结合 起 来 ， 进 行 分 析 ， 在 此 基 

础 上 计划 它们 的 货 存 、 广 告 以 及 其 他 方面 的 企业 经 营 策略 。 

“企业 可 能 会 用 这 些 信息 分 析出 你 的 购买 习惯 ， 然后 通过 电子 邮件 和 其 他 途径 为 你 提供 

合 你 的 商品 信息 。 可 能 不 久 以 后 ， 你 和 你 身边 的 人 就 会 看 到 不 同 的 电视 广告 (这 些 广告 

就 是 基于 你 们 的 购买 习惯 而 安排 的 )。 

信息 收集 、 理 解 中 的 这 些 发 展 趋势 已 经 严重 地 涉及 到 了 个 人 隐私 问题 。 但 是 ， 那 些 问题 
并 不 是 本 书 所 关心 的 。 

这 类 型 的 应 用 称 为 联机 分 析 处 理 (Online Analytic Processing, OLAP), 与 之 相对 的 是 联 
机 事务 处 理 (Online Transaction Processing，OLTP)， 这 两 种 应 用 在 目的 和 技术 要 求 上 都 是 不 
同 的 。 

*。OLTP 的 目的 是 维护 数据 库 该 数据 库 一 个 企业 的 准确 模型 。 这 个 系统 应 提供 足够 大 的 事 

务 吞 吐 量 和 较 短 的 响应 时 间 以 满足 负载 的 要 求 ， 并 且 避 免 用 户 失 败 。 它 的 特征 包括 : 

* 简短 的 事务 。 
。 相 对 频繁 的 更 新 。 
。 只 涉及 数据 库 很 小 部 分 的 事务 处 理 。 
。OLAP 的 目的 是 使 用 数据 库 中 存储 的 信息 来 指导 企业 制定 决策 。 因 此 所 涉及 的 数据 库 非 
常 巨大 而 且 不 需要 完全 准确 或 时 刻 保持 为 最 新 数据 , .对 响应 时 间 的 要 求 也 不 是 很 苛刻 。 
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它 的 特征 包括 : 

。 复 杂 的 查询 。 

。 不 频繁 的 更 新 。 

* 涉 及 数据 库 很 大 部 分 的 事务 处 理 。 

我 们 在 1.4 节 的 OLAP 例 子 是 针对 一 个 连锁 超市 的 经 理 群 的 ， 他 们 需要 的 是 对 数据 库 进 行 
突 发 的 查询 (不 是 预先 设计 好 的 )， 来 指导 他 们 做 出 某 方面 的 决策 。 这 个 例子 很 形象 地 说 明了 
OLAP 的 特点 一 一 即席 的 查询 (事先 未 知 的 ) ， 它 的 用 户 是 一 些 不 具有 很 多 计算 机 知识 的 企业 
管理 人 员 。 

本 节 开 头 部 分 的 例子 描述 了 OLAP 的 新 型 的 应 用 。 企 业 使 用 预先 设计 好 的 查询 来 检索 
OLAP 数 据 库 ， 在 持续 运营 的 基础 上 定制 他 们 的 营销 以 及 企业 的 其 他 方面 的 策略 。 这 些 查 询 通 
常 是 复杂 的 ， 另 一 方面 ， 由 于 这 些 查询 在 决策 支持 中 的 关键 性 和 使 用 的 频繁 性 (例如 每 天 或 
每 周 使 用 )， 因 此 这 些 查 询 要 由 专业 人 员 来 设计 和 实现 。 

在 传统 的 OLAP 应 用 中 ，OLAP 数 据 库 中 的 信息 很 多 情况 下 仅仅 是 企业 每 天 的 交易 数据 
(可 能 来 源 于 OLTP 数 据 库 ) ; 而 在 一 些 新 型 的 应 用 中 ， 企 业 管 理 者 需要 根据 他 们 的 具体 应 用 
主动 地 收集 一 一 其 至 可 能 是 购买 一 些 另外 的 数据 。 

正如 前 面 描 述 ，OLAP 的 目的 是 针对 一 些 应 用 来 分 析 数 据 ， 所 以 提出 了 两 种 单独 的 却 彼此 
相关 的 技术 上 问题 : 

。 要 执行 的 分 析 过 程 和 这 些 过 程 所 需要 的 数据 。 例 如， 一 个 公司 想 决 定 下 一 阶段 生产 哪些 

产品 。 根 据 这 个 应 用 ， 它 设计 一 种 操作 ， 这 种 操作 需要 前 一 阶段 和 过 去 五 年 中 相应 阶段 

的 产品 销售 情况 的 数据 。 

。 获 得 分 析 所 需 的 大 批 数据 的 方法 。 例 如 ， 公 司 如 何 从 下 属 部 门 的 数据 库 抽 取 所 需 数据 ? 

在 OLAP 数 据 库 中 以 何 种 形式 存储 这 些 数据 ? 怎样 才能 对 分 析 所 需要 的 数据 进行 高 效率 

的 检索 ? 

第 一 个 问题 ， 由 于 它 需 要 针对 公司 的 具体 业务 来 设计 特殊 的 算法 ， 所 以 不 是 数据 库 方面 
的 问题 ， 故 我 们 主要 讨论 第 二 个 问题 ， 即 针对 分 析 操 作 ， 我 们 需要 设计 什么 样 的 数据 库 。 假 
设 检索 出 的 数据 只 是 显示 在 屏幕 上 。 然 而 ， 在 很 多 情况 下 ， 尤其 是 在 一 些 新 的 应 用 中 ， 这 些 
数据 还 要 作为 复杂 的 分 析 操 作 的 输入 。 

数据 仓库 

OLAP 数 据 库 通常 存储 在 专门 的 OLAP 服 务 器 上 ， 这 个 服务 器 称 为 数据 仓库 (data 
warehouse ) 。 我 们 构造 数据 仓库 来 支持 OLAP 查 询 。 这 些 查询 可 能 非常 复杂 ， 如 果 它 们 在 
OLTP 数 据 库 上 进行 ， 可 能 慢 得 让 人 无 法 忍受 

我 们 将 在 19.7 节 讨论 填充 数据 仓库 涉及 的 一 些 问 题 。 首 先 ， 我 们 看 看 数据 仓库 中 要 存储 哪 
些 数 据 


19.2 OLAP 应 用 的 多 维 模型 


1. 事实 表 和 维 表 
许多 OLAP 应 用 和 1.4 节 的 超级 市 场 的 例子 很 相似 : 分 析 不 同时 间 段 中 不 同 超级 市 场 的 不 
同 商品 的 销售 额 。 我 们 用 图 19-1 中 的 关系 表 来 描述 这 样 的 销售 数据 。Market_Id 表 示 一 个 超级 
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市 场 ，Product_Id 表 示 一 种 商品 ，Time_Id 表 示 一 个 特定 的 时 间 段 ，Sales_Amt 表 示 在 指定 时 间 
段 、 指 定 超级 市 场 中 特定 产品 的 销售 总 额 〈 以 美元 计 )。 这 种 表 称 为 事实 表 (fact table), A 
为 它 包含 了 分 析 所 需要 的 所 有 事实 。 


M1 Pi T1 


















1000 
Mi P2 Ti 2000 
M1 P3 T1 1500 
M1 P4 T1 2500 
M2 Pi T1 500 
M2 P2 Ti 800 
M2 P3 Ti 0 
M2 P4 Tt 3333 
M3 Pi T1 5000 
M3 P2 Ti 8000 
M3 P3 Ti 10 
M3 P4 Tl 3300 
M1 Pi T2 1001 
M1 P2 T2 2001 
M1 P3 T2 1501 
Mi P4 T2 + | 2501 
M2 Pi T2 501 
M2 P2 T2 801 
M2 P3 T2 1 

















图 19-1 超级 市 场 应 用 程序 的 事实 表 


Sales_Amt 属 性 的 取 值 是 Market_Id、Product_Id、Time_Id 这 三 个 维 的 值 的 函数 ， 所 以 我 
们 可 以 把 这 个 销售 数据 看 作 是 多 维 的 《multi-dimensional)。 在 这 张 表 中 ， 前 三 列表 示 三 个 维 ， 
第 四 列表 示 实 际 的 销售 数据 。 
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我 们 也 可 以 考虑 把 事实 表 中 的 数据 存放 到 一 个 多 维 的 立方 体 中 ， 图 19-2 显 示 用 数据 立方 


体 表 示 超 级 市 场 例子 中 的 数据 的 情况 。 这 个 立 
方 体 是 三 维 的 ， 三 个 维 分 别 是 Market_Id 、 
Product_Id、Time_Id， 立 方 体 的 每 个 单元 
(cell) 表示 相应 的 Sales_Amt 的 值 ， 这 种 多 维 
的 视图 可 以 直观 地 表示 OLAP 的 查询 和 结果 。 
每 一 维 的 另外 的 信息 可 以 存储 到 维 表 
(dimension table) 中 , 维 表 描 述 每 个 维 的 属性 ， 
比如 Market_Id、Product_Id 和 Time_Id。 在 上 
面 例子 中 ， 可 以 有 三 张 维 表 ， 分 别称 为 
MARKET、PRODUCT 和 TIME， 如 图 19-3 所 示 。 


Product_Id 





图 19-2 超级 市 场 应 用 程序 的 三 维 立方 体 


MARKET 表 说 明 超 级 市 场 的 地 理 位 置 ， 位 于 哪个 地 区 、 州 、 城 市 。 在 一 个 更 真实 的 例子 中 ， 这 
张 表 包 含 了 一 个 超级 市 场 构成 的 链 ， 每 个 区 包含 多 个 州 ， 每 个 州 包含 多 个 城市 ， 每 个 城市 包 




















































































含 多 个 超市 。 
| Maner | Market_Id Region 
M1 Stony Brook | New York East 
M2 Newark New Jersey East 
M3 Oakland California West 
Product_id Category 
Beer Drink 
Diapers Soft Goods 
Cold Cuts Meat 
Soda Drink 
T1 January First 
T2 June Second 
T3 December Fourth 
图 19-3 超级 市 场 应 用 程序 的 维 表 
2. 星 型 模式 


可 以 用 一 张 图 (如 图 19-4 所 示 ) 表示 超级 市 场 这 个 例子 所 蕴含 的 关系 ， 这 张 图 就 像 一 颗 
星星 ， 中 间 是 一 张 事实 表 ， 向 周围 辐射 出 维 表 ， 所 以 称 之 为 星 型 模式 。 在 OLAP 中 ,; 这 种 模式 
是 很 常见 的 。 值 得 注意 的 是 ， 星 型 模式 和 实体 -联系 (E-R) 图 很 相似 ， 事 实 表 对 应 一 个 联系 ， 


维 表 对 应 实体 。 


如 有 果 把 维 表 都 规范 化 (一 张 维 表 可 能 变 成 几 张 表 ) ， 那 么 这 幅 图 会 变 得 更 复杂 ， 从 而 形成 
雪花 的 结构 ， 这 种 模式 被 称 为 雪花 模式 (snowflake schema)。 但 是 ， 由 于 以 下 两 个 原因 ， 我 


们 很 少 规范 化 维 表 。 


“通过 规范 化 维 表 所 节约 的 空间 和 事实 表 所 占 的 空间 相 比 是 微不足道 的 。 
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“很 少 会 更 新 维 表 ， 所 以 不 必 考 虑 由 于 维 表 不 规范 所 带 来 的 更 新 异常 。 而 且 ， 如 果 把 维 表 
中 的 关系 分 解 为 3NF 或 BCNF， 会 使 得 查询 非常 复杂 ， 如 8.13 节 所 述 。 


ms 


图 19-4 超级 市 场 示例 的 星 型 模式 


除了 星 型 模式 外 , 很 多 OLAP 应 用 还 使 用 星座 模式 (constellation schema). 在 这 种 模式 中 ， 
可 能 多 个 事实 表 共 享 一 张 或 多 张 维 表 。 例 如 ， 超级 市 场 的 应 用 还 需要 另外 一 张 事实 表 
INVENTORY ， 它 需要 维 表 WAREHOUSE、PRODUCT 和 TIME， 如 图 19-$ 所 示 。 维 表 PRODUCT 和 TIME 
就 被 事实 表 INVENTORY 和 SALES 共 享 ， 而 WAREHOUSE 没 有 被 共享 。 








图 19-5 扩展 的 超级 市 场 示 例 的 星座 模式 


19.3 BE 


很 多 OLAP 查 询 涉及 对 事实 表 中 数据 的 聚合 (aggregation )。 例 如 ， 下 面 的 SQL 语句 表示 
查询 每 个 超级 市 场 中 每 种 产品 的 销售 总 量 (所 有 时 间 段 销售 额 的 和 ) 。 


SELECT S.Market_Id, S.Product_Id ; SUM(S.Sales_Amt) 
FROM SALES S 
GROUP BY S.Market_Id, S.Product_Id 


这 个 查询 返回 的 结果 如 图 19-6 所 示 ， 它 可 以 看 成 一 个 二 维 的 立方 体 ， 每 个 单元 的 值 是 对 
Salcs_Amt 的 值 的 聚合 。 由 于 聚合 是 对 整个 时 间 维 进行 的 ( 即 结果 不 依赖 于 时 间 坐标 )， 所 以 
通过 聚合 ， 产 生 了 一 个 压缩 后 的 维 视图 ， 由 原来 的 三 维 变 为 现在 的 两 维 ， 

19.3.1 下 钻 、 上 卷 、 切片 和 切 块 
一 些 维 表 中 包含 有 聚合 层次 结构 (aggregation hierarchy), fin, 维 表 MARKET 表 示 层 次 
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结构 。 

Market_Id 一 City 一 State 一 Region 
这 意味 着 地 区 包含 州 ， 州 包含 城市 ， 城 市 包含 超级 市 场 。 我 们 可 以 在 层次 结构 的 不 同 层 上 进 
行 查询 ， 例 如 : 


SELECT S.Product_Id, M.Region, SUM(S.Sales_Amt) 
FROM SALES S, MARKET M 

WHERE M.Market_Id = S.Market_Id 

GROUP BY M.Region, S.Product_Id 


查询 结果 如 图 19-7 所 示 ， 每 个 单元 的 值 是 每 个 地 区 中 每 件 产 品 的 销售 总 额 。 






Market_Id SUM(Sales_Amt) Region 
SUM(Sales_Amt) ` 


North South East West 


M3 












15003 P1 0 0 4506 15003 
Product_Id P2 | 6003 2402 24003 Product_Id P2 | 0 0 8405 24003 
P3 | 4503 3 33 P3 | 0 0 4506 33 
P4 | 7503 7000 9903 P4 | 0 0 14503 9903 
图 19-6 在 时 间 维 上 育 合 Sales_Amt 的 查询 结果 图 19-7 在 地 区 上 下 外 的 查询 结果 


当 我 们 执行 的 查询 从 层次 结构 中 较 高 的 层次 移动 到 粒度 更 小 的 层次 ， 即 从 比 概括 到 具体 
(HAMA “E” ERAS “A” WRA), KARERA FSA (drilling down), FRE 
更 具体 的 信息 。 因 此 ， 为 了 得 到 “月 ”上 的 聚合 ， 我 们 可 能 需要 事实 表 或 在 “天 ”上 聚合 了 
的 表 。 当 我 们 从 层次 结构 中 较 低 的 层次 移 到 较 高 的 层次 (从 “天 ”上 的 聚合 到 “ 周 ” 上 的 豪 
合 )， 我 们 称 为 上 卷 (rolling up)。 像 这 样 在 时 间 维 上 进行 下 钻 或 上 卷 是 很 常见 的 ， 因 为 我 们 
总 是 要 总 结 每 天 、 每 月 或 者 每 季度 的 销售 额 。 

还 有 一 些 相 关 的 OLAP 术 语 。 当 我 们 观察 多 维 立 方 体 时 ， 我 们 可 能 选择 其 中 的 坐标 轴 的 一 
个 子 集 ， 我 们 称 为 执行 一 次 转轴 (pivot)。 被 选择 的 坐标 轴 对 应 于 GROUP BY 子 句 中 的 那些 属 
性 。 从 另 一 个 角度 看 ， 转 轴 是 对 GROUP BY 子 句 中 没有 出 现 的 维 的 聚合 。 

下 面 的 查询 就 是 对 多 维 立 方 体 执行 转轴 ， 以 便 从 产品 和 时 间 维 上 查看 该 立方 体 。 查 询 找 
出 今年 每 个 季度 的 每 件 产品 的 销售 总 额 (在 所 有 超级 市 场 的 聚合 ) ， 查 询 结果 如 图 19-8 所 示 。 


SELECT S.Product_Id, T.Quarter, SUM(S.Sales_Amt) 
FROM SALES S, TIME T . 19.1 
WHERE T.Time_Id = S.Time_Id (19.1) 
GROUP BY T.Quarter, S.Product_Id 
Ve 
\ con vy D vy 
如 果 我 们 在 GROUP BY 子 句 中 用 年 代替 季度 ， 这 就 是 在 时 间 层 次 结构 中 上 卷 。 
SELECT S.Product_Id, T.Year, SUM(S.Sales_Amt) 
FROM SALES S, TIME T f 
WHERE T.Time_Id = S.Time_Id 
GROUP BY T.Year, S.Product_Id 


SQL:1999 和 其 他 一 些 OLAP 三 商 支 持 一 种 扩展 的 SQL 语句 : ROLLUP， 用 它 来 简化 上 卷 操 
fe (参见 19.3.2 节 )。 值 得 注意 的 是 ， 相 应 的 下 销 操作 却 没有 对 应 的 语句 ， 这 是 因为 上 卷 不 仅 
给 用 户 设计 查询 提供 便利 ， 它 还 能 优化 查询 处 理 。 比 如 ， 用 户 首先 在 “季度 ”上 进行 了 聚合 ， 
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然后 要 在 所 得 结果 上 进行 上 卷 在 “年 ”上 聚合 ， 处 理 器 只 要 在 第 一 步 的 查询 结果 上 再 进行 聚 
合 就 行 了 ， 这 样 可 以 大 大 减少 第 二 步 的 处 理 时 间 。 这 样 的 优化 是 不 可 能 用 于 下 钻 的 。 

不 是 所 有 的 聚合 层次 结构 都 像 地 理 位 置 层 次 结构 那样 是 线性 的 ， 图 19-9 中 的 时 间 层 次 结 
构 是 一 个 格 。“ 月 ”不 包含 “星期 "， 因 为 一 个 星期 可 能 包含 在 两 个 月 中 。 所 以 ,我 们 可 以 把 
“天 ”上 卷 到 “星期 ”或 “月 *, 但 从 “星期 ”只 能 上 卷 到 “季度 ”中 。 


Year 





SUM(Sales_Amt) Quarter 


First Second Third Fourth Quarter 





P1 6500 6503 0 6506 
Product_Id P2 10800 10803 0 10806 Week Month 


P3 | 1510 1513 0 1516 
P4 | 9133 9136 0 6137 N Lo 
图 19-8 表示 每 个 季度 产品 销售 总 额 的 查询 结果 图 19-9 以 时 间 层 次 结构 作为 一 个 格 


注意 ， 上 面 的 所 有 查询 都 需要 访问 事实 表 中 的 大 量 数据 。 与 之 相反 ， 本 地 超级 市 场 数据 
库 上 的 OLTP 查 询 现在 番茄 汁 缮 头 有 多 少 存货 只 需要 访问 数据 库 中 相应 的 一 条 记录 。 

切片 和 切 块 

维 上 的 每 个 层次 结构 都 把 多 维 立方 体 分 成 几 个 子 立方 体 。 例 如 ， 时 间 维 上 的 Quarter (地 
E) 把 整个 立方 体 分 成 四 个 子 立方 体 。 每 个 立方 体 存储 一 个 季度 的 数据 。 返 回 这 些 子 立方 体 
信息 的 查询 称 为 切片 (slice) 或 切 块 (dice )。 

“通过 在 查询 中 使 用 GROUP BY 子 名 来 限定 层次 的 某 一 部 分 (或 全 部 )， 我 们 把 整个 多 维 

立方 体 分 成 若干 个 子 立方 体 ， 这 就 是 一 个 切 块 操作 。 查 询 (19.1) 在 表 SALES 中 的 时 间 维 

上 执行 了 切 块 ， 它 把 时 间 维 按 季度 切 成 四 块 ， 相 应 地 把 立方 体 切 成 四 个 子 立方 体 ， 每 个 

子 立 方 体 表 示 一 个 季度 的 数据 。 

。 通 过 使 用 WHERE 子 句 ， 我 们 用 等 式 来 把 维 属性 和 一 个 常量 比较 ， 这 样 就 可 以 在 查询 中 

给 某 个 维 指定 特定 值 ， 这 就 是 一 个 切片 操作 。 如 果 在 上 面 查询 中 ， 我 们 需要 观察 时 间 段 

T1 上 每 个 市 场 的 销售 情况 ， 那 就 要 在 时 间 维 上 进行 切片 。 

可 以 看 出 ， 切 块 是 按 某 个 维 把 立方 体 分 成 相应 的 子 立方 体 ， 而 切片 是 只 取出 其 中 的 某 一 
个 子 立 方 体 。 | 


19.3.2 CUBE 操 作 符 


很 多 OLAP 查 询 需 要 使 用 府 合 函数 ， 一 般 是 通过 在 SELTCT 语 句 中 使 用 GROUP BY 子 句 来 
实现 聚合 。SELECT 语 句 的 规则 限制 OLAP 查 询 的 类 型 ， 而 这 些 查询 在 SQL 中 是 很 容易 编写 的 。 
OLAP) W (LARSQL:1999) 在 SQL 中 加 入 了 另外 的 聚合 函数 ， 并 且 有 的 厂商 允许 用 户 使 用 
自己 设计 的 聚合 函数 。 

一 种 扩展 是 ROLLUP 子 句 ， 另 一 一 种 扩展 是 CUBE 操 作 符 [Gray et 21.1997]. 下 面 用 一 个 例子 
来 讲述 CUBE 操 作 符 的 使 用 。 为 了 得 到 这 样 一 张 表 (如 图 19-10 所 示 )， 它 和 图 19-6 中 的 表 很 相 
似 ， 不 同 之 处 是 它 要 显示 每 行 、 每 列 的 总 数 。 如 果 使 用 SQL 语句 构造 这 张 表 ， 我 们 需要 执行 
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下 面 的 三 个 SELECT 语句 来 检索 必要 的 信息 。 








SUM(Sales_Amt) Market_Id 
M1 M2 M3 Total 
P1 3003 1503 15003 19509 
Product_Id P2 6003 2402 24003 32408 
P3 4503 3 33 4539 
P4 7503 7000 9903 24406 
Total 21012 10908 48942 80862 





图 19-10 以 电子 表格 形式 出 现 的 销售 应 用 程序 的 查询 结果 
第 一 个 查询 得 到 表 中 间 的 数据 (得 不 到 总 数 )。 


SELECT S.Market_Id, S.Product_Id, SUM(S.Sales_Amt) 
FROM SALES S 
GROUP BY S.Market_Id, S.Product_Id 

第 二 个 查询 得 到 每 行 的 总 数 。 
SELECT S.Product_Id，SUM(S.Sales_Amt) 
FROM SALES S 
GROUP BY S.Product_Id 

第 三 个 查询 得 到 每 列 的 总 数 。 
SELECT S.Market_Id, SUM(S.Sales_Amt) ` 
FROM SALES S 
GROUP BY S.Market_Id 


这 几 个 SELECT 语句 是 必需 的 ， 因 为 我 们 要 得 到 三 个 聚合 ， 分 别 是 按时 间 、 按 产品 Id 和 时 
间 、 按 市 场 d4 和 时 间 ， 每 一 个 都 需要 不 同 的 GROUP BY 子 句 。 

独立 地 计算 这 三 个 查询 无 疑 是 对 时 间 和 计算 资源 的 浪费 ， 第 一 个 查询 的 很 多 结果 在 后 两 
个 查询 中 都 会 用 到 。 如 果 我 们 保存 第 一 个 查询 的 结果 然后 在 Market_Id 和 Product_Id 上 聚合 ， 
就 会 节省 很 多 资源 。 这 种 形式 的 计算 高 效 性 在 OLAP 中 是 非常 重要 的 ， 研 究 者 们 做 了 很 多 这 方 
面 的 工作 。 例 如 [Agrawal et al.1996 ，Harinarayan et al.1996，Ross and Srivastava 1997，Zhao 
et al.1998], . 

CUBE 子 句 的 主要 目的 是 可 以 有 效 地 进行 扩展 [Gray et al.1997]，SQL:1999 标 准 中 包含 有 
这 个 子 句 。 当 在 GROUP BY 子 句 中 使 用 CUBE 时 ， 形 式 如 下 : 

GROUP BY CUBE (v1, v2,---, vn) ; . 
这 个 查询 相当 于 一 组 GROUP BY 查询 ， 其 中 每 一 个 对 应 于 (v1,v2,…,vn) 的 一 个 子 集 。 举 个 例子 : 


SELECT S.Market_Id, S.Product_Id, SUM(S .Sales_Amt) 
FROM SALES S 
GROUP BY CUBE(S.Market_Id, S.Product_Id) 


得 到 的 结果 如 图 19-11 所 示 ， 它 相当 于 上 面 三 个 查询 ， 故 等 价 于 图 19-10。NULL 表 示 是 一 个 聚 
合 。 比 如 Product_Id 列 中 的 第 一 个 NULL 表 示 这 是 超市 M1 的 所 有 产品 的 销售 总 额 9 。 


O 在 这 种 情况 下 , SQL 中 的 NULL 的 使 用 有 些 混乱 , 因为 这 时 NULL 的 实际 含义 是 所 有 ( 它 是 某 一 维 上 的 聚合 ) 。 
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图 19-11 用 CUBE 操 作 符 返回 的 结果 集合 


ROLLUP 和 CUBE 有 点 相似 ， 它 们 的 区 别 是 CUBE 在 参数 的 所 有 子 集 上 做 聚合 ， 而 
ROLLUP 选 择 一 些 子 集 进行 聚合 ， 选 择 规则 是 对 GROUP BY ROLLUP 子 句 中 的 维 从 右 向 左 依 
次 诊 合 。SQL:1999 标 准 也 包含 有 ROLLUP 子 句 。 

把 上 面 的 查询 中 的 CUBE 换 成 ROLLUP， 得 到 下 面 的 查询 : 


SELECT S.Market_Id, S. Product_Id, SUM(S.Sales_Amt) 
FROM SALES S (19.2) 
GROUP BY ROLLUP(S.Market_Id, S.Product_Id) 


上 述 查 询 首 先 从 最 小 的 粒度 开始 聚合 ， 相 当 于 GROUP BY S.Market_Id, S.Product_Id， 然 后 使 
用 “GROUP BY S.Market_Id” 聚 合 ， 最 后 ， 计 算出 总 数 ， 它 相当 于 空 的 GROUP BY 子 句 。 
结果 如 图 19-12 所 示 。 如 果 是 更 复杂 的 情况 (ROLLUP 子 句 中 包含 更 多 的 属性 )， 相 应 的 结果 
表 中 首先 会 有 一 些 最 后 一 列 是 NULL 的 元 组 ， 然 后 是 最 后 两 列 为 NULL 的 元 组 ， 接 下 来 是 最 后 
三 列 为 NULL 的 元 组 ， 依 此 类 推 。 

OLAP 的 扩展 SQL 语 名 中 的 ROLLUP 操 作 符 其 实 是 在 聚合 层次 结构 上 的 上 卷 操作 的 概 化 。 
而 且 ， 用 小 粒度 上 的 聚合 结果 计算 较 大 粒度 上 的 聚合 可 以 节约 成 本 显然 也 适用 于 ROLLUP 操 
作 符 。 例 如 ， 在 查询 (19.2) 中 ， 子 名 GROUP BY S.Market_Id, S.Product_Id 的 聚合 结果 会 在 
GROUP BY S.Market_Id 的 聚合 计算 中 用 到 。 这 些 计 算 结 果 会 在 更 大 粒度 的 聚合 上 用 到 。 

用 CUBE 操 作 符 物化 视图 l 

可 以 用 CUBE 操 作 符 来 预先 把 事实 表 所 有 维 上 的 所 有 聚合 都 计算 出 来 ， 然 后 把 结果 存储 到 
数据 库 中 ， 供 以 后 的 查询 使 用 。 
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SELECT S.Market_Id, S.Product_Id, SUM(S.Sales_Amt) 

FROM SALES S 、 

GROUP BY CUBE(S.Market_Id, S.Product_Id, S.Time_Id) 
上 述 查 询 产 生 的 结果 是 图 19-1 中 的 所 有 元 组 再 加 上 图 19-13 中 的 所 有 元 组 。 将 这 个 结果 表 存 储 
为 物化 视图 ， 那 么 在 以 后 的 查询 中 使 用 时 会 提高 查询 的 速度 。 








RESULT SET Market_ Id Sales_Amt 
M1 Pi 3003 
Mi P2 6003 
Mi P3 4503 
M1 P4 7503 
M2 Pi 1503 
M2 P2 2402 
M2 : P3 3 
M2 P4 7000 
M3 Pl | 15003 
M3 P2 24003 
M3 P3 33 








M3 P4 9902 
Mi NULL 21012 
M2 NULL 10908 
M3 NULL 48092 
NULL 80862 





图 19-12 利用 ROLLUP 操 作 符 返回 的 结果 集 


6500 





图 19-13 由 CUBE 操 作 符 附加 到 事实 表 的 元 组 
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M2 


M3 
M1 
M2 
M3 
M1 
M1 
M1 
M1 
M2 
M2 
M2 
M2 
M3 
M3 
M3 
M3 
NULL 
NULL 
NULL 


NULL 
NULL 
NULL 
NULL 
M1 
M2 
M3 
NULL 















NULL 
NULL NULL 10908 
NULL NULL 48942 
NULL NULL 80862 








图 19-13 ( 续 ) 


一 些 物 化 了 的 视图 (使 用 或 不 使 用 CUBE 操 作 符 ) 可 以 在 整个 OLAP 应 用 中 提高 查询 性 能 。 
当然 ， 要 存储 这 些 物 化 视图 就 需要 另外 的 空间 ， 所 以 ， 要 考虑 物化 的 视图 的 个 数 。 由 于 数据 
更 新 很 不 频繁 ， 故 不 用 考虑 物化 视图 的 更 新 间 题 。 


19.4 ROLAP#IMOLAP 


可 以 把 OLAP 数 据 库 按照 星 型 模式 存储 在 关系 数据 库 中 。 这 种 实现 称 为 关系 OLAP 
(ROLAP )。 

另 一 些 OLAP 服 务 器 的 三 商 使 用 多 维 实现 (不 是 关系 实现 ) 以 数据 立方 体 (data cube) 的 
方式 实现 事实 表 , 同时 存储 大 量 预 先 计 算 好 的 聚合 结果 。 这 种 实现 称 为 多 维 OLAP (MOLAP)。 
值得 注意 的 是 ， 在 ROLAP 实 现 中 ,数据 立 方 体 是 看 待 数 据 的 一 种 方式 ， 在 MOLAP 实 现 中 ， 
数据 存储 在 某 种 可 以 表示 数据 立方 体 的 结构 中 。 

CUBE 操 作 符 的 用 途 之 一 就 是 从 SQL 数 据 库 中 提取 数据 用 来 生成 MOLAP。 许 多 MOLAP 系 
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统 允 许 用 户 指定 要 物化 哪些 视图 。 它 的 数据 库 中 实现 了 一 些 在 OLAP 中 常用 到 的 操作 (不 是 关 
系 型 的 )， 比 如 在 层次 结构 的 不 同 级 别 上 的 聚合 。 

对 于 MOLAP 实 现 ， 没 有 统一 的 查询 语言 标准 。 不 过 很 多 MOLAP 厂 商 〈 以 及 ROLAP 厂 商 ) 
提供 了 其 专用 的 语言 《有 的 是 可 视 化 的 )， 使 得 那些 缺乏 计算 机 相关 技术 的 用 户 可 以 只 使 用 简 
单 的 查询 就 得 到 图 19-10 那 样 的 表 ， 然 后 可 以 在 表 上 执行 转轴 、 上 卷 、 下 钻 等 操作 ， 有 时 仅仅 
需要 点 击 鼠 标 就 可 以 实现 查询 。 

并 不 是 所 有 的 商业 决策 支持 应 用 都 必须 用 ROLAP 或 MOLAP 数 据 库 服 务 器 ， 很 多 应 用 仍 
使 用 传统 的 关系 数据 库 ， 只 是 添加 一 些 针对 具体 应 用 的 特殊 模式 。 比 如 ， 本 书 中 一 些 复杂 的 
SQL 查 询 可 视 为 OLAP 查 询 (如 ， 列 出 教授 所 有 课程 的 所 有 教授 ……)。 实 际 上 ， 所 有 带 有 复 
杂 的 联结 和 伐 套 的 SELECT 语句 的 查询 仅仅 可 以 用 来 做 分 析 ， 因 为 在 OLTP 数 据 库 上 执行 这 种 
查询 的 速度 太 慢 。 


19.5 实现 中 的 一 些 问题 
大 多 数 OLAP 系 统 的 实现 技术 都 是 针对 OLAP 应 用 的 特点 设计 的 : 
OLAP 有 大 量 的 数据 ， 这 些 数据 比较 稳定 ， 很 少 更 新 。 


而 且 ， 很 多 技术 都 包括 了 预先 计算 部 分 查询 和 使 用 索引 ， 如 果 设 计 系 统 时 知道 主要 执行 
哪些 查询 ， 可 以 使 预先 计算 和 索引 有 很 好 的 针对 性 。 例 如 ， 当 它们 被 娱 入 到 一 个 运作 OLAP 应 
用 中 。 如 果 数 据 库 设 计 者 或 管理 员 对 要 执行 的 查询 有 一 定 的 了 解 时 ， 也 可 以 在 即席 查询 中 应 
用 它们 。 i 

一 种 技术 是 预先 计算 一 些 常用 的 聚合 并 把 结果 存储 在 数据 库 中 。 其 中 包括 一 些 对 维 层次 
结构 的 聚合 。 由 于 数据 不 经 常 改变 ， 所 以 维护 这 些 结果 的 开销 不 会 太 大 。 

另 一 种 技术 是 针对 要 执行 的 查询 使 用 相应 的 索引 。 由 于 数据 比较 稳定 ， 所 以 维护 索引 的 
开销 也 是 很 小 的 。 联 结 索引 和 位 图 索引 是 比较 常用 的 两 种 索引 。 

1. 星 型 联结 和 联结 索引 

星 型 模式 中 关系 的 联结 叫做 星 型 联结 (star join)， 可 以 用 联结 索引 (在 11.7.2 节 中 介绍 ) 
来 优化 这 种 联结 。 所 有 大 型 商业 数据 库 管理 系统 的 最 新 版 本 都 支持 星 型 联结 。 

2. 位 图 索引 

位 图 索引 (11.7 节 介绍 ) 对 取 值 个 数 较 少 的 那些 属性 尤其 有 效 。 在 OLAP 中 ， 这 种 属性 是 
很 常见 的 。 比 如 ， 表 MARKET 中 Region 属 性 只 取 四 个 值 : North、South、East 和 West。 如 果 表 
MARKET 有 10 000 行 ， 属 性 Region 上 的 位 图 索引 包含 4 个 位 向 量 ， 大 约 需 要 40 000b 或 5KB 的 存 
储 空间 。 这 种 大 小 的 可 以 放 在 内 存 中 用 以 优化 查询 。 


19.6 数据 挖掘 


数据 挖 据 (data mining) 的 目的 是 知识 发 现 ， 即 在 大 数据 集 上 寻找 模式 和 结构 ， 而 不 是 
查询 特定 的 信息 。 如 果 说 OLAP 是 验证 已 知 的 结论 ， 那 么 数据 挖 气 就 是 探索 未 知 的 规律 
数据 挖掘 使 用 的 技术 来 源 于 很 多 领域 ， 例 如 统计 分 析 和 人 工 智能 。 我 们 将 引领 大 家 了 解 
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这 些 技术 以 及 它们 如 何 用 于 处 理 大 数据 集 。 

1. 关联 

数据 挖 据 中 一 个 非常 重要 的 应 用 是 寻找 关联 。 关 联 (association) 就 是 在 数据 库 中 特定 值 
之 间 的 相关 性 。 在 1.4 节 中 我 们 给 出 过 这 样 的 例子 : 


每 天 傍晚 ， 大 多 数 在 便利 店 购买 了 尿布 的 顾客 会 同时 购买 啤酒 。 
这 条 关联 规则 表示 为 


Purchase_diapers => Purchase_beer ~ (19.3) 


怎样 来 判定 一 条 关联 规则 呢 ? 假定 便利 店 


























有 一 张 PURCHASEs 表 ， 该 表 可 以 从 OLTP 系 统 中 PURCHASES | Transaction_Id a 
提取 出 来 (如 图 19-14 所 示 ) ， 数 据 挖掘 系统 根 001 beer 
据 这 张 表 中 计算 两 个 度量 ， 用 它们 来 考察 关联 001 popcorn 
规则 : oz diapers 
。 关 联 规则 的 置信 和 度 (confidence): 同时 002 cheese 
包含 规则 两 边 的 项 的 交易 数 在 包含 规则 on soda 
左边 的 项 的 交易 数 中 占 的 百分比 。 在 图 on ee 
19-14 的 例子 中 ， 前 三 个 交易 都 包含 “ 尿 003 diapers 
布 ， 其 中 前 两 个 交易 同时 又 包含 有 “ 啤 Ooo cord cuts 
酒 " ， 所 以 关联 规则 (19.3) 的 置信 度 是 003 napkins 
66.66%. 004 cereal 
° 关联 规则 的 支持 度 (support): 同时 包含 008 beer 





cold cuts 


规则 两 边 的 项 的 交易 数 在 所 有 交易 中 占 

的 百分比 。 在 图 19-14 的 例子 中 ， 四 个 交 图 19-14 用 于 数据 控 握 的 PuRcHAsEs 表 

易 中 有 两 个 同时 包含 “尿布 ”和 “啤酒 ”， 所 以 这 条 关联 规则 的 支持 度 是 50%。 

置信 度 用 来 衡量 如 果 一 个 交易 包含 规则 左边 的 项 (Purchase_diaper)， 那 么 它 会 同时 包含 
规则 右边 的 项 (Purchase_beer) 的 概率 。 如 果 这 个 概率 很 高 ， 便 利 店 老板 就 可 以 考虑 在 尿布 
货架 的 旁边 摆 放 啤酒 。 

但 是 ， 只 赁 置信 度 还 不 足以 确定 这 条 规则 的 可 靠 性 ， 这 条 规则 还 应 该 在 统计 上 是 有 意义 
的 。 例 如 ， 关 联 规则 Purchase_cookies => Purchase_napkins 的 置信 度 是 100%， 但 只 有 一 条 交易 
满足 这 条 关联 规则 ， 那 么 它 是 没有 意义 的 。 支 持 度 就 是 衡量 规则 是 否 是 有 意义 的 ， 它 衡量 满 
足 关联 规则 的 交易 在 所 有 交易 中 所 占 的 百分比 。 

为 了 保证 一 条 关联 规则 是 有 意义 的 ， 置 信和 度 和 支持 度 都 要 大 于 某 个 冰 值 。 ‘eR Eta 
值 属 于 统计 分 析 领 域 ， 本 书 不 讲述 这 方面 的 内 容 。 

一 条 关联 规则 可 能 涉及 不 止 两 个 项 。 例 如 ， 如 果 一 个 顾客 购买 了 奶 酷 和 需 钙 鱼 ， 那 么 他 
很 可 能 也 购买 面包 圈 〈 如 果 他 只 买 奶酪 ， 则 可 能 另 有 它 用 ， 那 他 就 不 会 买 面包 圈 )。 


Purchase_creamcheese AND Purchase_lox => Purchase_bagels 
对 于 这 个 关联 规则 ， 置 信 度 就 是 包含 规则 中 所 有 项 的 交易 在 包含 规则 前 两 项 的 交易 中 所 
占 的 百分比 。 
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给 出 一 个 关联 规则 ， 然 后 计算 它 的 置信 度 和 支持 度 是 很 简单 的 ， 只 需要 执行 一 次 OLAP 查 
询 就 可 以 了 。 如 有 果 是 要 寻找 所 有 置信 度 和 支持 度 大 于 闪 值 的 关联 规则 ， 则 要 困难 得 多 ， 这 就 是 
一 个 数据 挖掘 查询 。[Agrawal et al. 1993] 首 先 提出 了 关联 规则 的 数据 挖 据 和 早期 的 一 些 算法 。 

下 面 介 绍 一 种 有 效 的 算法 ， 用 该 方法 检索 相关 数据 以 得 到 支持 度 大 于 给 定 阔 值 T 的 所 有 关 
联 规则 。 正 如 我 们 将 要 看 到 的 ， 一 旦 找到 了 这 些 规则 ， 计 算 它 的 置信 度 是 否 大 于 给 定 阔 值 就 
比较 容易 了 。 

假设 我 们 要 寻找 所 有 支持 度 大 于 阔 值 T 的 关联 规则 A= 一 B ， 一 种 最 原始 的 方法 就 是 计算 A， 
和 B, 的 所 有 可 能 的 不 同 项 的 组 合 的 支持 度 ， 选 出 那些 大 于 T 的 组 合 。 但 是 如 果 一 共有 nn 个 项 ， 
则 要 验证 n(n~1) 种 组 合 ， 这 显然 是 不 可 行 的 。 

有 一 种 更 为 有 效 的 算法 称 为 apriori 算 法 ， 它 基于 下 面 的 结论 : 


如 果 关 联 规则 A 二 B 的 支持 度 大 于 T， 那 么 A 和 B 的 支持 度 都 大 于 T9 。 


(显然 ， 如 果 在 R 个 交易 中 A 和 B 都 出 现 ， 那 么 A 和 B 分 别 单独 出 现 的 次 数 肯定 不 小 于 R. ) 

所 以 首先 计算 每 个 项 的 支持 度 ， 找 出 那些 大 于 T 的 项 ， 共 需要 计算 an 次， 假设 有 m 个 项 满 
足 条 件 (m 很 可 能 比 n 小 得 多 )， 然 后 在 这 mm 个 项 的 组 合 上 找 由 那些 支持 度 大 于 T 的 组 合 ( 共 需 
计算 mlm-1) 种 组 合 )， 假 设 找 到 p 个 规则 满足 条 件 ， 那 么 需要 验证 2p 个 规则 的 置信 度 是 否 大 于 
BE. 

2. 序列 模式 

如 果 在 图 19-14 的 表 中 加 入 两 列 Customer_Id 和 Date ， 我 们 还 可 以 挖掘 出 有 关 顾 客 在 不 同时 
间 的 购买 情况 的 规则 。 

一 个 顾客 买 了 某 个 牌子 的 奶酪， 那么 以 后 他 还 会 买 这 种 牌子 的 奶 酷 吗 ? 

一 个 顾客 买 了 垃圾 桶 ， 那 么 过 一 段 时 间 他 会 买 垃圾 桶 的 盖子 吗 ? 

这 种 就 是 序列 模式 (sequence pattem ) ， 很 多 挖掘 关联 规则 的 技术 可 以 应 用 到 挖掘 序列 模 
式 上 。 

3. 分 类 规则 i 

Sy RAG BS HE AE PA REPRE RARA, AER RR RETAN. A 
如 ， 抵 押 贷 款 机 构 利用 顾客 的 年 收入 和 净 资 产 来 预测 他 是 否 会 拖欠 偿还 贷款 。 为 了 达到 这 个 
目的 ， 抵 押 贷 款 机 构 可 能 会 分 析 关 联 规则 


((10 000<P.Income<50 000) AND (P.Networth<100 000) )=>(P.Default=" yes') 


是 否 成 立 (其 中 P 指 顾客 )。 如 果 这 条 规则 成 立 ， 那 些 满足 左边 条 件 的 顾客 就 会 被 划分 到 “可 
能 拖欠 ”的 类 别 中 。 分 类 规则 和 关联 规则 的 不 同 之 处 在 于 分 类 规则 一 般 使 用 属性 值 的 范围 而 
关联 规则 使 用 单个 值 ， 但 支持 度 和 置信 度 的 衡量 方法 对 于 二 者 是 相同 的 。 
4. 机 器 学 习 

机 器 学 习 (属于 人 工 智能 的 一 个 分 支 ) 领域 中 有 大 量 技术 可 以 应 用 在 数据 挖掘 中 。 接 着 
前 面 的 例子 ,假如 抵押 贷款 机 构想 预测 申请 者 是 否 会 拖欠 ， 他 可 能 考虑 更 多 的 因素 ， 并 且 这 


些 因素 的 重要 性 是 不 一 样 的 ， 要 给 每 个 因素 赋 以 不 同 的 权重 。 


O 单个 项 (MA) 的 支持 度 是 包含 A 的 事务 的 百分比 。 
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要 想 了 解 如 何 应 用 权重 制定 决策 ， 假 定 仍 只 考虑 两 个 因素 : 年 收入 和 净 资 产 。 赋 权重 给 
条 件 (10 000 < P.Income < 50 000)， 将 权重 c: 赋 给 条 件 (PNetworth < 100 000) ， 就 得 到 了 一 个 表 
达 式 

QIXI + AX, 
如 果 第 一 个 条 件 满足 ， 则 zi=1， 反 之 nm=-1; 第 二 个 条 件 也 一 样 。 如 果 对 于 一 个 顾客 ， 表 达 式 
的 值 不 小 于 阔 值 +， 即 

aX, + dX > t 
那么 ， 这 个 顾客 就 属于 “可 能 拖欠 ”的 顾客 ， 反 之 就 属于 “不 会 拖欠 ”的 顾客 。 实 际 上 ,在 
计算 时 还 会 包含 其 他 许多 的 因素 。 现 在 的 问题 是 : 怎样 来 决定 这 些 权重 和 阔 值 ? 

一 种 称 为 神经 网 络 (neural net) 的 技术 通过 考察 已 有 数据 中 的 信息 来 “学 习 ” 相 关 的 权 
重 ， 以 便 预 测 顾客 的 行为 ， 并 对 未 来 的 顾客 的 行为 进行 预测 。“ 学 习 ” 指 的 是 系统 利用 数据 库 
以 往 顾客 拖欠 或 按时 还 款 的 信息 来 逐渐 的 调整 这 些 权重 使 预测 效果 达到 最 佳 。 

上 面 的 不 等 式 可 以 看 作 基本 神经 元 (neuron 或 者 nerve cell) 行为 的 一 个 模型 。 如 果 输 入 
(afix) 的 加 权 求 和 大 于 阐 值 ， 则 称 这 个 神经 元 被 激活 。 使 用 数据 库 中 以 前 顾客 的 信息 ， 一 
个 神经 元 的 简单 学 习 算 法 如 下 所 示 : 

1) 把 所 有 权重 和 疹 值 初始 化 为 0。 

2) 每 次 把 一 个 顾客 的 信息 输入 到 这 个 神经 元 模型 (计算 上 述 表达 式 )， 看 求 得 的 结果 是 否 
正确 (正确 是 指 如 果 顾客 拖欠 了 贷款 ， 则 表达 式 的 值 大 于 阔 值 ; 如 果 没 拖欠 贷款 ， 则 表达 式 
HENTAR). 

a. 如 果 神 经 元 结果 正确 ， 则 不 对 权重 和 阔 值 进行 改动 。 

b. 如 果 表 达 式 本 应 大 于 阔 值 ， 而 计算 结果 相反 ， 则 修改 权重 和 阔 值 。 修 改 规则 为 : 依据 

每 个 输入 项 是 正 还 是 负 ， 把 相应 的 权重 和 阐 值 在 同方 向 上 乘 一 个 系数 ， 使 表达 式 大 于 
PMA. BD, Rel, Miaka (GERAD) ; 如 果 w=-1， 则 把 a 缩小 4 
倍 ， 把 :缩小 d 倍 。 

c. 如 果 表 达 式 不 应 大 于 阅 值 ， 而 计算 结果 却 大 于 六 值 ， 同 样 要 修改 权重 和 阅 值 。 修 改 规 
则 为 : 依据 每 个 输入 项 是 正 还 是 负 ， 把 相应 的 权重 和 阔 值 在 反方 向 上 乘 一 个 系数 ， 使 
表达 式 大 于 阔 值 。 即 ， 如 果 x=1， 则 把 ai 缩小 d 倍 (GEA AF) ; 如 果 x=~1, 则 
把 交大 d 倍 ， 把 :放大 d 倍 。 

3) 重复 第 二 步 ( 即 每 次 考察 一 个 顾客 )， 直 到 神经 元 错误 率 较 小 并 且 权 重 变 得 比较 稳定 为 

止 。 这 说 明神 经 元 “学 习 到 ”了 顾客 的 信息 ， 现 在 就 可 以 用 这 些 权重 对 未 来 顾客 进行 预测 了 。 

这 个 算法 有 一 个 性 质 [Novikoff 1962]: 如 果 一 个 神经 元 总 是 能 做 出 正确 的 决定 ， 那 么 可 以 
通过 有 限 次 调整 ， 使 得 权重 和 阅 值 收 化 于 正确 的 值 。 但 在 实际 应 用 中 ， 结 果 人 往 往 不 是 这 样 的 ， 
因为 只 有 一 个 神经 元 的 模型 很 难 真实 地 模拟 现实 应 用 。 所 以 提出 用 多 个 神经 元 组 成 网 络 并 利 
用 相应 的 更 为 复杂 的 计算 权重 的 算法 ， 这 里 不 详细 描述 。 

应 该 指出 的 是 ， 神 经 网 络 在 信用 调查 上 的 使 用 是 机 器 学 习 和 数据 挖 所 最 成 功 的 商业 应 用 
之 一 。 
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19.7 数据 仓库 的 数据 载 入 


用 于 OLAP 和 数据 挖掘 的 数据 通常 存储 在 一 个 特殊 的 数据 库 中 ， 这 种 数据 库 称 为 数据 仓库 
(data warehouse)。 数 据 仓库 非常 大 ， 可 能 包含 在 多 个 时 间 段 从 不 同 的 数据 源 提 取出 的 TB 级 的 
数据 ， 还 可 以 包含 不 同 的 厂商 生产 的 具有 不 同 模式 的 数据 库 。 把 这 些 数据 集成 到 一 个 数据 库 
中 不 是 一 个 简单 的 工作 。 当 这 些 数据 需要 周期 性 地 更 新 时 ， 还 会 产生 很 多 别 的 问题 。 

在 把 这 些 数据 装载 到 数据 仓库 前 ， 一 般 要 对 它 执行 两 个 很 重要 的 操作 。 

1) 变换 (transformation) ”必须 对 来 自 不 同 数据 库 管理 系统 中 的 数据 进行 语法 或 语义 的 变 
换 ， 使 之 变 为 数据 仓库 需要 的 统一 的 格式 。 

a. 语 法 变换 不 同 数据 库 管理 系统 表示 相同 数据 的 语法 很 可 能 是 不 同 的。 比如 ， 社 会 安全 

号 在 有 的 数据 库 中 用 属性 SSN 表 示 ， 而 在 其 他 数据 库 中 是 用 Ssnum 表 示 ; 可 能 一 个 是 字 
符 串 型 ， 另 一 个 是 整数 型 。 
b. 语义 变换 “不 同 数据 库 管 理 系 统 表示 相同 数据 的 语义 很 可 能 是 不 同 的 。 比 如 ， 数 据 仓 
库 要 求 对 数据 按 “ 天 ”来 进行 综合 ， 而 有 的 数据 库 是 按 “ 小 时 ”综合 的 ， 而 有 些 数据 
库 则 根本 不 综合 ， 只 是 记录 每 次 交易 的 信息 。 

2) 数据 清理 (data cleaning) ”必须 对 数据 的 错误 和 缺失 进行 处 理 。 我 们 可 能 会 认为 其 他 
OLTP 数 据 库 中 的 数据 肖 定 是 正确 的 ， 但 在 现实 中 通常 不 是 这 样 。 另 外 ， 一 些 错误 也 可 能 来 源 
于 OLTP 数 据 库 以 外 的 途径 ， 比 如 因特网 上 表格 信息 的 压缩 代码 错误 。 

通常 情况 下 ， 这 两 种 操作 都 称 为 “数据 清理 "。 尽 管 没有 明确 的 设计 理论 来 执行 这 些 操 作 ， 
但 大 多 数 厂商 都 提供 了 一 些 工具 来 执行 这 些 操作 。 

如 果 数 据 源 的 模式 是 关系 数据 库 ， 和 数据 仓库 的 模式 非常 相似 ， 没 有 必要 进行 数据 清理 ， 
那么 可 以 仅仅 使 用 SQL 语句 来 从 数据 元 提取 数据 ， 然 后 存储 到 数据 仓库 中 。 例 如 ， 在 一 个 连 
锁 超 市 的 每 家 分 店 的 数据 库 M 中 ， 都 有 表 M_SALES 模 式 为 M_SALES(Product_Id, Time_Id, 
Sales _Amb ， 它 记录 了 分 店 M 的 每 个 时 间 段 的 每 件 产品 的 销售 情况 。 那 么 ， 在 时 间 段 T4 后 ， 
我 们 可 以 使 用 下 面 的 语句 来 更 新 数据 仓库 中 的 事实 表 〈 图 19-1)， 把 M 在 时 间 段 T4 的 销售 情况 
添加 进去 。 


INSERT INTO SALES(Market_Id, Product_Id, Time_Id, Sales_Amt) 
SELECT Market_Id = 'M', S.Product_Id, S.Time_Id, S.Sales_Amt 
FROM M_SALES S$ 
WHERE S.Time_Id = 'T4' 


如 果 需 要 数据 清理 或 重新 格式 化 ， 可 以 把 数据 源 的 数据 看 做 没有 物化 的 视图 。 在 这 个 视 
图 上 通过 数据 清理 程序 提取 数据 (不 需要 数据 源 数据 模式 的 信息 ) ， 然 后 进行 进一步 的 操作 。 

和 其 他 类 型 的 数据 库 一 样 ，OLAP 数 据 库 也 需要 有 元 数据 库 (metadata repository), MÆ 
记录 数据 的 逻辑 和 物理 结构 ， 包 括 模式 、 索 引 等 。 对 于 数据 仓库 ， 元 数据 库 中 还 应 该 包括 数 
据 源 的 信息 以 及 装载 和 刷新 数据 的 信息 。 

OLAP 数 据 库 的 大 量 数据 使 得 数据 的 载 和 人 和 更 新 都 变 得 很 困难 。 为 了 提高 效率 ， 一 般 采 取 
增 量 式 的 更 新 ， 即 在 不 同 的 时 间 更 新 数据 库 的 不 同 部 分 。 然 而 ， 这 种 更 新 方式 会 使 得 数据 库 
有 了 时 处 于 不 一 致 的 状态 。 一 般 情况 下 这 不 会 给 OLAP 造 成 很 大 问题 ， 因 为 大 多 数 数据 分 析 只 是 
综合 性 的 和 统计 意义 上 的 分 析 ， 不 一 致 状态 对 这 种 分 析 的 影响 不 大 。 
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图 19-15 描 述 了 装载 OLAP 数 据 库 的 过 程 。 








元 数据 仓库 





外 部 数据 源 F 





图 19-15 OLAP 数 据 库 的 数据 装载 


19.8 参考 书目 


术语 OLAP 由 Codd 在 [Codd 1996] 提 出 。[Chaudhuri and Dayal 1997] 对 联机 分 析 处 理 进行 了 很 好 的 介 


绍 。[Fayyad et al. 1996] 中 包含 关于 数据 挖掘 的 应 用 和 研究 的 最 新 文章 


[Gray et al. 1997] 介 绍 了 CUBE 操 作 符 。 [Agrawal et al. 1996,Harinarayan et al. 1996,Ross and 


Srivastava 1997,Zhao et al. 1998] 讨 论 了 如 何 高 效 地 计算 数据 立方 体 ; [Agrawal et al. 1993] 提 出 了 关联 规 
则 的 按 拨 思想 和 一 些 早期 算法 。[Han and Kamber 2001] 是 一 本 综合 介绍 数据 挖掘 的 书 。 


19.9 练习 


19.1 
19.2 
19.3 
19.4 
19:5 


典型 的 BCNF 事 实 表 是 否 符合 BCNF? 说 明 原因 。 

为 什么 把 星 型 模式 看 成 E-R 模 型 时 ， 事实 表 是 联系 而 维 表 是 实体 ? 

设计 一 个 超级 市 场 进行 OLAP 时 会 用 到 的 事实 表 和 相应 的 维 表 (不 同 于 前 面 讲述 的 例子 )。 

解释 为 什么 不 能 把 学 生 注册 系统 的 数据 库 建 模 为 星 型 模式 ? 

为 超级 市 场 设计 一 个 SQL 查 询 ， 返回 结果 和 图 19-10 相 似 ， 不 同 之 处 是 在 “ 州 ” 上 聚合 商店 ， 在 

“月 ”上 聚合 时 间 。 

a. 使 用 CUBE 或 者 ROLLUP 操 作 符 。 

b. 不 使 用 CUBE 或 者 ROLLUP 操 作 符 。 

c. 计算 结果 表 。 

a. 为 上 述 的 超级 市 场 的 例子 设计 一 个 查询 ， 返回 每 个 分 店 的 销售 总 额 。 

b. 计算 出 结果 表 。 

假设 一 个 应 用 有 4 张 维 表 ， 每 张 维 表 有 100 行 。 

a. 计算 事实 表 有 多 少 行 。 

b. 假 设 一 张 表 中 有 一 个 可 以 取 10 个 值 的 属性 ， 如 果 要 为 这 个 属性 建立 一 个 位 图 索引 ， 需要 多 少 
字 节 ? 

è. 计算 用 来 联结 一 张 维 表 和 事实 表 的 联结 索引 的 最 大 大 小 。 

d. 如 果 要 用 CUBE 操 作 符 来 对 事实 表 的 4 个 维 进行 聚合 ， 那么 结果 表 一 共有 多 少 行 ? 

© 如 果 要 用 ROLLUP 操 作 符 来 对 事实 表 的 4 个 维 进行 聚合 ， 那么 结果 表 一 共有 多 少 行 ? 
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头 重 新 计算 。 

19.9 为 CUBE 操 作 符 设计 一 个 查询 评估 算法 ， 这 个 算法 使 用 以 前 得 到 的 了 察 合 结果 来 计算 新 的 察 合 。( 提 
as: 把 所 有 的 GROUP BY 子 句 组 织 成 一 个 格 。 例 如 ，GROUP BY A > GROUP BY A,B > GROUP 
BY ABC 以 及 GROUP BY B > GROUP BY B,C > GROUP BY A,B,C。 描 述 格 中 低层 次 的 聚合 怎样 
用 来 计算 高 层次 的 聚合 。) 

19.10 假设 图 19-1 中 的 事实 表 进 行 了 CUBE 操 作 ， 返 回 结果 存储 在 一 个 视图 SALES_V1 中 。 设 计 一 个 对 该 
表 的 查询 ， 返 回 图 19-10 和 19-7 的 表 。 

19.11 建立 一 个 OLAP 应 用 来 分 析 我 们 大 学 中 的 分 数 情况 。 分 数 用 整数 0 ~ 4 表示 (4 代表 A)， 我 们 想 知 
道 不 同 课程 、 不 同 教授 、 不 同系 在 不 同学 期 、 不 同学 年 的 平均 成 绩 。 给 这 个 应 用 设计 一 个 星 型 
模式 。 

19.12 讨论 分 别 用 多 维 数组 和 事实 表 实 现 数据 立方 体 在 存储 需求 上 的 区 别 。 

19.13 对 图 19-14 中 的 表 执 行 一 个 apririo 算 法 ， 找 出 所 有 的 二 项 关联 规则 。 

19.14 在 什么 情况 下 ， 关 联 规则 的 置信 度 总 是 大 于 支持 度 。 

19.15 试 举 出 本 书 所 给 例子 之 外 的 装载 数据 到 数据 仓库 的 语义 变换 、 语 法 变换 的 例子 。 





第 四 部 分 
事务 处 理 


现在 我 们 开始 学 习 事务 处 理 。 

在 第 20 章 ， 我 们 将 对 事务 的 ACID 性 质 以 及 这 些 性 质 如何 与 正确 
的 调度 相关 联 给 出 详细 的 描述 。 

在 第 21 章 和 第 22 章 ， 我 们 将 描述 多 种 事务 模型 以 及 事务 处 理 系统 
的 体系 结构 。 

从 第 23 章 ~ 第 26 章 ， 我 们 将 看 到 每 一 个 ACID 性 质 如 何在 集中 式 - 
系统 和 分 布 式 系统 中 实现 。 

。 在 第 23 章 和 第 24 章 ， 我 们 讨论 隔离 性 的 实现 ， 首 先是 普遍 意义 

上 的 实现 ， 然 后 是 在 关系 数据 库 上 的 实现 。 我 们 将 看 到 SQL 支 

持 的 各 种 隔离 性 级 别 ， 以 及 除了 SERIALIZABLE 隔 离 级 别 , 在 

其 他 隔离 级 别 下 产生 正确 调度 的 方法 。 

。 在 第 25 章 ， 我 们 将 讨论 在 事务 异常 中 止 、 系 统 崩 渍 和 数据 库存 

储 介质 损坏 几 种 情况 下 ， 原 子 性 和 持久 性 的 实现 。 

。 在 第 26 章 ， 我 们 探讨 事务 的 ACID 性 质 在 分 布 式 环境 下 的 实现 。 

在 第 27 章 ， 我 们 将 研究 安全 性 和 因特网 商务 ， 包 括 众所周知 的 因 
特 网 协议 (如 SSL 和 SET)。 





第 20 章 事务 的 ACID 性 质 


我 们 假设 事务 在 一 些 应 用 程序 的 内 部 执行 ， 而 这 些 应 用 程序 包含 一 个 或 多 个 作为 真实 世 
界 企 业 模 型 的 数据 库 9 。 事 务 是 能 完成 下 列 功能 的 程序 : 

1) 事务 能 更 新 数据 库 ， 以 反映 影响 数据 库 所 建 模 企业 状态 的 真实 世界 事件 的 发 生 。 一 个 
例子 就 是 银行 的 储蓄 事务 : 事件 是 顾客 把 现金 交 给 出 纳 ， 事 务 在 数据 库 中 更 新 顾客 的 账户 信 
BRR. 

2) 事务 能 确保 一 个 或 多 个 真实 世界 事件 的 发 生 。 一 个 例子 就 是 在 自动 取款 机 (ATM) 上 的 
取款 事务 : 事件 是 现金 的 提取 ( 当 且 仅 当 取款 事务 成 功 执行 时 )。 

3) 事务 能 从 数据 库 中 获取 信息 。 如 打印 顾客 银行 账户 信息 的 事务 。 

前 两 项 功能 之 间 的 差异 在 于 : 在 第 一 项 功能 里 ， 真 实 世 界 的 事件 已 经 发 生 ， 事 务 只 是 更 
新 数据 库 以 反映 这 一 事实 ; 而 在 第 二 项 功能 里 ， 真 实 世 界 的 事件 是 由 事务 触发 的 。 

一 个 事务 能 完成 以 上 三 项 功能 。 例 如 ， 存 款 事务 能 执行 以 下 功能 : 

”了 更 新 数据 库 ， 以 反映 顾客 把 现金 交 给 出 纳 这 一 真实 世界 的 事件 。 

2) 当 且 仅 当 事务 成 功 执行 时 ， 触 发 打印 存款 收据 这 一 真实 世界 的 事件 。 

3) 从 数据 库 中 返回 有 关 该 顾客 账户 的 信息 。 7 

在 2.3 节 ， 我 们 看 到 一 组 事务 的 执行 是 受 某 些 特殊 性 质 约束 的 (如 ACID 性 质 ) ， 它 们 不 适 
用 于 一 般 的 程序 。 在 本 章 中 ， 我 们 将 讨论 这 一 主题 。 


20.1 一 致 性 


一 个 数据 库 相 对 于 其 所 表示 的 真实 世界 企业 模型 ， 既 充当 主动 的 角色 又 充当 被 动 的 角色 。 
在 被 动 角色 中 ， 它 维护 数据 库 状 态 和 企业 状态 之 间 的 对 应 性 。 例 如 ， 学 生 注册 系统 必须 准确 
地 维护 每 名 学 生 的 14 和 选修 每 门 课程 的 学 生 人 数 ， 因 为 这 里 没有 纸 质 的 注册 记录 。 从 主动 性 
角色 来 讲 ， 它 强制 执行 企业 特定 的 规则 。 例 如 ， 选 修一 门 课程 的 学 生 人 数 不 能 超过 数据 库 中 
存储 的 这 门 课程 的 最 大 注册 学 生 数 (2.3 节 约束 IC2)。 试 图 选修 一 门 选课 人 数 已 满 的 事务 是 不 
能 成 功 执行 的 。 

一 致 性 可 以 用 来 说 明 这 些 问题 ， 它 包含 两 个 方面 的 内 容 。 

1. 数据 库 必 须 满足 所 有 完整 性 约束 

不 是 所 有 的 数据 库 状 态 都 是 被 允许 的 ， 有 以 下 两 个 方面 的 原因 : 

“内 部 一 致 性 〈internal consistency)。 便 于 在 不 同 的 表单 中 存储 相同 的 信息 。 例 如 : 我 们 

可 以 存储 选修 一 门 课程 的 学 生 人 数 以 及 选修 该 课程 学 生 的 姓名 列表 ， 列 表 的 长 度 不 等 于 

选课 学 生 人 数 的 数据 库 状 态 是 不 允许 的 (2.3 节 的 约束 IC3)。 


O 一 些 人 可 能 认为 数据 库 不 是 对 真实 世界 的 建 模 ， 而 是 对 真实 事件 一 部 分 的 建 模 ， 即 数据 库 的 内 容 实 际 上 决 
定 着 真实 世界 的 状态 。 





#20 ¢ FFHACIDBA 505 


。 企 业 规则 (enterprise rule)。 企 业 规 则 限制 企业 可 能 的 状态 。 当 企业 规则 存在 的 时 候 ， 

数据 库 可 能 的 状态 也 相应 地 受到 限制 。 以 上 的 选课 学 生 人 数 和 最 大 注册 人 数 的 关系 规则 

就 是 一 个 例子 。 选 课 人 数 大 于 最 大 注册 人 数 的 状态 是 不 允许 存在 的 。 

这 些 约束 称 为 完整 性 约束 (integrity constraint) ， 有 时 也 称 为 一 致 性 约束 (consistency 
constraint ) 。 每 个 事务 的 执行 必须 保持 所 有 完整 性 约束 。 

2. 数据 库 必 须 基 于 真实 世界 企业 状态 来 建 模 

从 这 一 意义 上 来 讲 ， 事 务必 须 是 正确 的 ， 并 按 其 语义 来 更 新 数据 库 。 新 的 数据 库 状 态 必 
须 反 映 真实 世界 新 的 状态 。 例 如 ， 注 册 事务 必须 增加 数据 库 中 存储 选课 学 生 人 数 的 变量 的 值 ， 
并 将 学 生 添加 到 选修 课程 学 生 姓名 列表 中 。 注 册 事 务 成 功 执行 但 不 更 新 数据 库 而 使 数据 库 保 
持 一 致 性 状态 ， 这 时 数据 库 的 状态 并 没有 显示 学 生 选 课 成 功 。 同 样 ， 在 某 储户 账户 上 记录 存 
款 的 储 革 事务 ， 不 更 新 数据 库 而 使 数据 库 保持 一 臻 性， 数据库 的 这 种 状态 就 不 能 反映 真实 世 
界 的 状态 。 

我 们 可 以 通过 检查 数据 库 快照 (或许 在 这 一 时 刻 没有 事务 执行 ) 中 数据 项 的 值 ， 来 判断 
它 是 否 满足 所 有 完整 性 约束 。 但 这 并 不 表明 数据 库 的 状态 能 准确 地 反映 真实 世界 中 企业 的 状 
态 。 问 题 在 于 仅 数据 库 处 于 一 致 性 状态 是 不 够 的 ， 每 个 事务 也 必须 满足 一 致 性 。 


事务 的 一 致 性 (transaction consistency) “事务 设计 者 可 以 假设 ， 在 事务 开始 执行 时 ， 
数据 库 满 足 所 有 完整 性 约束 。 事 务 设计 者 必须 保证 ， 事 务 执行 完成 后 ， 数 据 库 仍然 
会 满足 所 有 完整 性 约束 ， 数 据 库 的 新 状态 是 事务 规格 说 明 中 描述 的 变换 的 反映 。 


这 里 的 一 致 性 有 两 层 含义 。 一 是 数据 库 的 一 致 性 ， 指 数据 库 满足 所 有 完整 性 约束 。 另 一 
层 含义 是 事务 的 一 致 性 ， 如 果 处 于 隔离 状态 事务 的 执行 使 处 于 一 致 性 状态 的 数据 库 变化 到 新 
的 一 致 性 状态 ， 那 么 数据 库 的 新 状态 也 要 满足 事务 的 规格 说 明 要 求 。 

记 住 ， 编 写 一 致 性 的 事务 是 编写 事务 程序 的 应 用 程序 员 的 基本 职责 。 其 他 事务 处 理 系统 
也 假设 满足 一 致 性 并 提供 原子 性 、 隔 离 性 和 持久 性 ， 这 些 性 质 在 确保 一 致 性 事务 的 并 发 执行 
时 是 必要 的 ， 即 使 在 出 现 故障 的 情形 下 ， 也 能 维持 数据 库 状 态 和 企业 状态 之 间 的 关系 。 


完整 性 约束 的 检查 


SQL 提供 一 些 维持 完整 性 约束 的 支持 。 在 设计 数据 库 时 ， 特 定 的 完整 性 约束 可 以 组 织 成 
SQL 断言 、 键 约束 等 。 例 如 ，PRIMARY KEY 约 束 可 以 消除 记录 在 数据 库 中 的 两 名 学 生 具 有 
相同 ID 的 可 能 (2.3 节 的 约束 IC0)。 约 束 CHECK 能 维持 注册 人 数 与 最 大 注册 人 数 之 间 的 关系 。 
ASSERTION 能 确保 ， 某 门 课程 的 教室 能 容纳 的 学 生 人 数 大 于 最 大 选课 学 生 人 数 。 在 一 个 事务 
执行 时 ， 如 果 要 访问 模式 的 约束 中 包含 的 数据 ， 数 据 库 管 理 系 统 会 自动 检查 以 防止 事务 违反 
约束 ， 并 阻止 任何 违反 约束 事务 的 执行 。 

但 不 是 所 有 的 完整 性 约束 都 能 写 入 模式 中 。 即 使 能 写 人 模式 ， 有 时 我 们 也 不 这 样 设计 。 
相反 ， 约 束 是 在 事务 程序 内 部 检查 的 ， 这 样 决策 的 理由 是 检查 约束 非常 耗 时 。 如 果 把 约束 编 
和 人 入 模式 中 ， 修 改 任何 约束 所 引用 的 表 都 会 引起 约束 的 自动 检查 ， 从 而 导致 这 种 不 必要 的 检查 
经 常 进行 。 把 约束 检查 放 在 事务 中 后 ， 只 有 在 可 能 违反 约束 时 ， 约 束 检查 才 会 执行 。 例 如 ， 
选课 人 数 限制 不 可 能 在 注销 选课 时 违反 ， 因 而 在 注销 事务 执行 过 程 中 ， 即 使 选课 人 数 发 生 改 
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变 时 ， 也 不 会 做 约束 检查 〈 既 不 做 自动 检查 ， 也 不 必 做 其 他 检查 )。 这 样 做 的 优点 是 事务 设计 
者 只 需 把 约束 检查 的 代码 放 在 有 可 能 违反 约束 的 事务 中 。 

事务 内 部 的 约束 检查 有 一 些 严 重 的 歇 端 ， 增加 编程 错误 的 可 能 性 ， 维 护 代 价 高 。 假 设 在 
某 些 情形 下 ， 将 约束 IC2 修 改 为 ， 选 修 某 门 课程 的 学 生 数 不 能 超过 该 课程 的 教室 所 能 容纳 的 学 
生 数 。 利 用 内 部 约束 检查 ， 可 能 要 修改 多 个 事务 ， 并 重新 编译 和 测试 。 但 如 果 IC2 完 全 在 模式 
内 定义 ， 不 依赖 于 任何 事务 ， 则 容易 修改 ， 且 不 必修 改 其 他 事务 。 

作为 一 个 工作 单元 的 事务 

每 个 事务 都 要 满足 完整 性 约束 的 要 求 限制 了 设计 者 向 应 用 程序 中 的 每 个 事务 分 派 任务 。 
为 解释 这 种 限制 ， 一 些 作者 把 事务 定义 为 完成 一 个 “工作 单元 ”的 程序 ， 这 表示 在 真实 世界 
中 的 事件 发 生 时 ， 应 用 程序 中 的 每 个 事务 必须 按 要 求 完 成 更 新 数据 库 ， 并 维持 完整 性 的 所 有 
工作 (以 及 完成 其 他 必要 的 活动 )。 所 以 当 一 名 学 生 注册 一 门 课程 时 ， 更 新 选修 课程 人 数 的 事 
务 和 更 新 课程 花 名 册 的 事务 必须 同时 执行 ， 因 为 这 两 个 事务 都 不 满足 一 致 性 约束 要 求 。 在 这 
种 情况 下 ,“ 工 作 单 元 ”要 求 二 者 同时 更 新 ， 必 须 由 一 个 事务 来 完成 以 保持 一 致 性 的 约束 。 


20.2 原子 性 


系统 中 负责 事务 管理 和 数据 库 管 理 系 统 访问 控制 的 部 分 称 为 TP 监 控 器 (TP monitor)。 除 
一 致 性 以 外 ，TP 监 控 器 还 必须 为 事务 如 何 执行 提供 其 他 保证 ， 其 中 一 项 保证 就 是 原子 性 。 

原子 性 (atomicity) ”系统 必须 确保 事务 一 直 运 行 到 完成 ， 或 如 果 没 有 运行 完成 ， 将 

不 产生 任何 影响 (就 像 没有 运行 一 样 )。 

常规 的 操作 系统 通常 不 保证 原子 性 。 在 (常规 ) 程序 执行 期 闻 ， 如 果 系 统 崩溃 ， 系 统 崩 
省 前 程序 对 文件 所 作 的 任何 修改 ， 在 系统 重新 启动 后 都 将 保留 下 来 。 如 果 这 些 变化 使 文件 处 
于 一 种 不 正确 的 状态 ， 那 么 操作 系统 不 负责 纠正 。 

这 种 行为 在 事务 处 理 系 统 中 是 不 可 接受 的 。 一 名 学 生 要 么 注册 选修 一 门 课程 ， 要 么 不 选 
修 课 程 。 不 完整 的 注册 选修 过 程 不 但 没有 任何 意义 ， 还 会 使 数据 库 处 于 一 种 不 一 致 的 状态 。 
例如 约束 IC3 说 明 ， 一 名 学 生 在 注册 选修 课程 时 ， 数 据 库 中 的 两 项 信息 都 必须 同时 更 新 。 如 果 
选课 事务 部 分 执行 ， 在 一 部 分 信息 更 新 后 ， 另 一 部 分 信息 更 新 之 前 系统 崩 祯 ， 这 就 会 导致 数 
据 库 处 于 不 一 致 的 状态 。 

如 果 事 务 成 功 执行 ， 且 系统 保存 执行 结果 ， 我 们 说 事务 已 提交 (committed). MEFS 
没有 成 功 完成 ， 我 们 说 事务 异常 中 止 (aborted) ， 这 时 系统 必须 撤销 (BAR, rolled back) 
事务 对 数据 库 所 做 的 任何 修改 。 我 们 将 在 25.2 节 看 到 ， 一 个 事务 处 理 系统 包含 复杂 的 异常 中 
止 事务 处 理 机 制 和 回 退 事务 影响 的 机 制 。 

从 上 面 的 讨论 可 以 得 出 以 下 重要 的 结论 : 


原子 性 的 执行 表明 事务 要 么 提交 ， 要 么 异常 中 止 。 


让 我 们 再 看 另外 一 个 例子 。 自 动 取 款 机 上 的 取款 事务 至 少 包 含 两 个 动作 : 在 顾客 的 账户 
上 记载 取款 数目 和 提取 相应 的 现金 。 事 务 原子 性 的 执行 表明 ， 如 果 事 务 提交 ， 这 两 个 动作 都 
必须 发 生 ; 如 果 事 务 异 常 中 止 ， 这 两 个 动作 都 不 发 生 (其 中 一 个 动作 是 数据 库 的 更 新 动作 ， 
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另 一 个 动作 是 真实 世界 的 现金 提取 动作 )。 

分 布 式 事务 是 在 不 同 地 点 访问 数据 库 的 事务 。 例 如 分 布 式 银行 事务 可 以 在 两 个 银行 的 两 
个 账户 上 转移 存款 。 原 子 性 要 求 : 车 事务 提交 ， 则 同时 更 新 ， 若 事务 异常 中 止 ， 则 不 做 任何 
修改 。 

1. 事务 为 什么 会 异常 中 止 

事务 异常 中 止 可 能 有 以 下 几 方 面 的 原因 ， 一 种 可 能 是 在 事务 执行 期 间 系 统 崩 溃 〈 事 务 提 
交 前 )， 另 一 种 可 能 是 在 分 布 式 事务 中 ， 系 统 中 的 某 个 数据 库 崩 涡 。 其 他 可 能 的 原因 有 : 

1) 事务 进入 死 锁 状 态 ， 不 能 获得 继续 执行 的 资源 。 

2) 事务 的 继续 执行 可 能 违反 完整 性 约束 。 

3) RS AGT THERM BREAK, 这 意味 着 可 能 发 生 20.4 市 所 描述 的 与 男 一 个 事务 错 
误 地 交互 执行 。 l 

最 后 ， 事 务 本 身 可 能 决定 异常 中 止 。 例 如 ， 用 户 可 能 按 取消 键 ， 或 事务 程序 可 能 遇 到 一 
些 导 致 事务 放弃 计算 的 条 件 (与 应 用 相关 的 )。 大 多 数 事务 处 理 系 统 有 一 个 异常 中 止 处 理 过 程 ， 
在 事务 异常 中 止 时 调用 。 严 格 来 讲 ， 这 样 的 一 个 过 程 是 没有 必要 的 。 因 为 事务 本 身 能 进行 相 
应 的 异常 中 止 处 理 ， 撤 销 任何 对 数据 库 所 做 的 修改 ， 然 后 提交 。 不 过 这 是 一 个 细致 而 又 易 出 
错 的 任务 ， 它 要 求 事务 记 住 对 数据 库 所 做 的 修改 ， 并 保存 足够 的 信息 使 数据 库 能 恢复 到 修改 
前 的 状态 。 既 然 系 统 必 须 包含 一 个 异常 中 止 处 理 过 程 ， 以 处 理 崩溃 和 其 他 的 一 些 情形 ， 所 以 
这 样 的 过 程 适 于 所 有 的 事务 。 事 务 设计 者 可 以 不 必 为 异常 中 止 处 理 编程 。 

2. 事务 编写 规范 | 

每 一 个 事务 处 理 系统 必须 提供 一 套 编 程 规范 ， 以 便 程序 员 界 定 一 个 事务 。 这 些 规范 在 不 
同 的 系统 中 是 不 同 的 。 例 如 ， 事 务 以 begin-transaction 命令 开始 ， 它 的 成 功 执行 可 能 以 
commit 命令 表示 。 

调用 commit 命 令 表示 一 个 提交 要 求 。 系 统 可 以 决定 提交 事务 ， 或 由 于 前 面 讨 论 的 理由 而 
异常 中 止 。rollback 命 令 用 来 事务 自身 中 止 ， 和 提交 请 求 相 反 ， 回 退 请 求 总 是 系统 所 称道 的 。 

当 一 个 分 布 式 事务 请 求 提 交 时 ， 参 与 事务 执行 的 各 个 地 点 的 计算 机 执行 提交 协议 
(commit protocol) ， 以 决定 请 求 是 否 被 批准 。 不 管 是 分 布 式 事务 还 是 非 分 布 式 事务 MRA 
统 决定 提交 事务 ， 就 执行 提交 操作 。 在 提交 操作 执行 前 ， 事 务必 须 处 于 一 种 未 提交 状态 (或 
还 有 可 能 异常 中 止 的 状态 )。 提 交 操 作 执行 后 ， 事 务 处 于 提交 状态 (不 可 能 再 处 于 异常 中 止 状 
态 )。 从 这 个 意义 上 来 讲 ， 提 交 操 作 是 原子 性 的 ， 不 存在 把 提交 状态 和 未 提交 状态 分 开 的 中 间 
状态 。 如 果 在 提交 的 过 程 中 系统 崩溃 ， 待 恢复 的 事务 要 么 已 经 提交 ， 要 么 尚未 提交 。 我 们 将 
在 25.2 节 对 提交 操作 进一步 讨论 。 


20.3 持久 性 


事务 处 理 系统 的 第 二 个 要 求 是 不 丢失 信息 。 例 如 ， 如 果 你 选修 一 门 课程 ， 不 论 是 发 生硬 
件 故 障 还 是 发 生 软件 故障 ， 你 都 希望 系统 保留 这 一 信息 。 即 使 第 二 天 因 冰 埠 导 致 断 电 和 计算 
机 竣 疾 (或 者 即使 这 在 你 提交 事务 后 的 一 微 秒 发 生 )， 你 还 是 能 上 这 门 课 。 常 规 的 操作 系统 不 
提供 这 种 持久 性 保证 。 备 份 可 以 被 保存 ， 但 不 能 确保 最 近 的 修改 是 持久 的 。 硬 件 故 障 不 仅仅 
局 限于 CPU 和 内 存 的 故障 ， 在 大 容量 的 存储 设备 发 生 故 障 时 ， 数 据 也 有 可 能 丢失 。 因 此 ， 我 
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们 给 出 如 下 的 持久 性 定义 : 


持久 性 (durability) ”系统 必须 确保 一 旦 事务 提交 ， 不 管 后 来 计算 机 和 存储 介质 是 否 
发 生 故 障 ， 其 执行 结果 必须 反映 在 数据 库 中 。 


持久 性 可 通过 在 不 同 备份 设备 上 宛 余 存 储 数 据 来 实现 。 这 些 设备 的 特性 导致 系统 有 不 同 
程度 的 可 用 性 (availability )。 如 果 设 备 速 度 快 ， 系 统 可 以 提供 无 间断 (nonstop) 服务 。 例 如 ， 
将 带 磁盘 镜像 (mirrored disk) 的 数据 库 备份 保存 在 两 个 不 同 的 大 容量 存储 设备 上 ， 能 对 两 个 
数据 库 快速 更 新 。 即 使 一 个 设备 故障 ， 保 存在 另 一 个 设备 上 的 数据 库 仍然 能 够 提供 服务 。 结 
R, 故障 对 用 户 是 不 可 见 的 。 电 话 系统 就 有 这 样 的 要 求 (尽管 在 实际 情况 下 并 不 一 定 总 是 满 
足 这 样 的 要 求 )。 

如 果 备 份 设备 速度 慢 ， 那 么 发 生 故 障 后 ， 在 数据 库 恢 复 (recovery) 期 间 ， 不 能 为 用 户 提 
供 服 务 。 大 多 数 的 航班 预定 系统 属于 这 一 类 型 ， 当 系统 暂时 不 能 提供 服务 时 ， 就 会 让 预定 航 
班 的 乘客 非常 气愤 。 学 生 注 册 系 统 也 属于 这 一 类 型 。 

在 真实 世界 里 ， 持 久 性 是 相对 的 。 在 发 生 以 下 事件 时 我 们 仍 希 望 已 提交 的 数据 仍 能 保留 
在 系统 中 。 

。CPU fii. 

* 磁盘 故障 。 

。 多 个 磁盘 故障 。 

。 火 灾 。 

* 恶意 攻击 。 

对 于 不 同 的 事件 ， 维 持 持久 性 的 代价 是 不 同 的 。 每 一 个 企业 有 必要 确定 其 要 保持 的 持久 
性 的 程度 ， 确 定 可 能 影响 持久 性 的 某 些 特定 的 故障 ， 以 及 为 保证 持久 性 所 愿意 付出 的 代价 。 


20.4 隔离 性 


在 讨论 一 致 性 的 时 候 ， 我 们 注重 单个 事务 的 影响 。 下 面 我 们 来 看 一 组 事务 集 执行 所 产生 
的 结果 。 如 果 一 组 事务 集 里 的 一 个 事务 在 另 一 个 事务 开始 执行 前 执行 结束 ， 那 么 我 们 说 事务 
集 是 按 顺 序 执行 的 ， 即 串 行 (serially) 执行 的 。 串 行 执行 的 优点 是 ， 如 果 所 有 事务 都 满足 
致 性 ， 那 么 开始 处 于 一 致 性 状态 的 数据 库 就 会 一 直 维持 在 一 致 性 状态 。 当 事务 集 的 第 一 个 事 
务 开始 执行 时 ， 数 据 库 处 于 一 致 性 的 状态 ， 因 为 事务 也 是 一 致 性 的 ， 所 以 在 事务 执行 结束 后 
数据 库 仍 满足 一 致 性 要 求 。 第 二 个 事务 的 执行 也 是 如 此 ， 一 直到 事务 集中 的 事务 全 部 执行 结 
RH Ak 

串 行 执行 对 性 能 要 求 一 般 的 应 用 程序 是 可 行 的 ， 但 对 有 严格 时 间 响 应 和 吞吐 量 的 应 用 程 
序 却 不 适用 。 幸 运 的 是 ， 现 代 计算 机 系统 的 CPU 和 输入 输出 处 理 器 是 由 一 组 处 理 器 组 成 的 ， 
能 并 发 执行 多 个 计算 和 多 个 输入 输出 。 另 一 方面 ， 事 务 通常 是 一 个 顺序 执行 的 程序 
(sequential program), ， 即 需要 CPU 参与 的 局 部 变量 计算 和 要 求 VO 从 数据 库 读 信息 与 向 数据 库 
写 信息 交替 执行 的 程序 。 对 这 两 种 情况 ， 每 次 都 需要 单独 的 处 理 器 服务 。 现 代 计算 系统 能 同 
时 为 一 个 以 上 的 事务 提供 服务 ， 我 们 称 这 种 执行 模式 为 并 发 执行 (concurrent execution)。 并 
发 执行 适合 在 事务 处 理 系统 中 为 多 个 用 户 提供 服务 。 这 样 ， 在 任意 给 定 的 时 间 内 ， 会 有 多 个 
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正在 执行 和 部 分 已 执行 完 的 事务 。 


一 TT 输出 的 数据 库 操作 序列 


输入 给 数据 库 管理 系统 
A 的 数据 库 操作 序列 


ae 
OP1.1 OP; 2 












OP1.1 OP2.; OP2 2 OP; 2 






OP2.1 OP22 


ae i ce 局 部 变量 


图 20-1 在 并 发 调度 中 ， 两 个 事务 对 数据 库 的 输出 操作 交错 进行 。 
ER, 其 中 opi 先 于 op 到 达 数 据 库 管理 系统 


在 并 发 执行 过 程 中 ， 如 图 20-1 所 示 ， 不 同事 务 的 数据 库 操作 随时 间 交 错 进 行 。 事务 T 在 使 
用 局 部 变量 计算 和 请 求 数据 库 操作 之 间 交 替 操 作 。 例 如 ， 一 个 操作 可 能 是 在 局 部 变量 和 数据 
库 之 间 传 输 数据 ， 也 可 能 是 对 某 些 数据 库 变量 执行 更 新 操作 。 请 求 由 操作 序列 op op ;的 序 
列 组 成 , ;我们 称 之 为 事务 调度 (transaction schedule). T, 的 计算 方式 也 同样 如 此 。 因 为 两 个 
事务 的 执行 不 是 同步 的 ， 所 以 传输 操作 到 达 数据 库 的 顺序 ( 称 之 为 一 个 调度 (schedule) ) 是 两 
个 序列 出 现 的 某 种 可 能 情况 。 在 图 20-1 中 ， 这 个 序列 是 opii; OP2.1; Op;2, OPi 26 | 

当 事 务 并 发 执行 时 ， 每 个 事务 保持 一 致 性 并 不 能 保证 数据 库 保持 一 致 性 .实际 上 ， 开 始 
处 于 一 致 性 的 状态 的 事务 虽然 在 提交 时 保证 数据 库 处 于 一 致 性 状态 ， 但 其 执行 过 程 中 的 中 间 
状态 不 一 定 是 一 致 性 的 。 另 外 ， 一 个 开始 处 于 一 致 性 状态 的 事务 ， 在 其 中 间 状 态 读 取 变量 什 
的 行为 是 不 可 预测 的 。 假 设 注册 人 员 定期 执行 审计 事务 打印 注册 学 生 和 注册 课程 记录 。 如 果 
事务 在 注册 事务 更 新 选课 记录 后 ;更 新 班级 花 名 册 表 之 前 岳 行 ， 则 此 时 打印 出 的 信息 是 不 
致 的 ， 因 为 注册 某 门 课程 的 学 生 记录 总 数 就 会 少 于 注册 记录 审 的 学 本数， 在 这 个 例子 里 面 ， 
尽管 审计 事务 打印 出 来 的 信息 是 不 一 致 的 ， 但 最 终 数据 库 还 是 僚 达 到 三 致 性 的 状态 

并 发 执行 可 能 会 破坏 一 致 性 。 在 图 2-4 中 ， 我 们 阐明 两 个 注册 事务 的 并 改 调 度 ， 导 致 更 新 
丢失 而 产生 的 不 一 致 。 因 为 有 31 名 学 生 注 册 了 某 门 课程 ， 但 只 有 30 名 学 生效 修 这 门 课程 ， 所 
以 最 终 的 数据 库 状态 没有 反映 这 一 现实 事实 。 因 为 班级 花 名 肌 中 有 31 条 记录 ， 所 以 数据 库 状 
态 不 满足 完整 性 约束 IC3。 2 

图 20-2 也 说 明了 这 种 丢失 更 新 (1ost update)。 在 这 种 情况 下 ， 两 个 银行 存款 事务 交错 进 
行 。 假设 这 里 唯一 的 完整 性 约束 是 账户 余额 大 于 零 。 事 务 Ti 试图 存款 5 元 ，T 存 款 20 元 。 第 __- 
步 ， 这 两 个 事务 读 到 的 余额 都 是 10 元 。 第 二 步 ，T; 写 入 30，Ti 写 人 15。 最 终 的 值 是 15 元 ， 事 
务 T 的 更 新 被 丢失 。 注 意 ， 数 据 库 最 终 状态 是 保持 一 至 性 的 ， 因 为 余额 大 于 零 。 但 实际 是 不 
正确 的 ， 余 额 应 该 是 35 元 。 如 果 事务 顺序 执行 ， 那 么 T 执 行 完成 才 人 允许 T, 执 行 ，T, 读 到 的 余 
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额 是 15 元 ， 那 么 这 两 个 事务 的 更 新 都 会 反映 到 最 终 的 数据 库 状 态 中 。 


T: 第 一 步 第 二 步 
读 (余额 ; 10) 写 (余额 : 15) 


第 一 步 第 二 步 
读 (BM: 10) 5 (余额 : 30) 





图 20-2 两 个 存款 事务 没有 相互 隔离 的 调度 


导致 这 种 错误 的 原因 是 并 发 事务 访问 共享 数据 一 一 数据 库 (这 是 操作 系统 中 讨论 的 关键 
问题 )。 基 于 这 个 原因 ， 在 学 习 并 发 事务 的 正确 性 时 ， 我 们 把 注意 力 放 在 访问 共享 变量 的 操 
作 一 一 对 数据 库 的 操作 上 。 


Ti: 写 操作 (先决 条 件 : 预备 课程 列表 ) 


To: 写 操作 (先决 条 件 : 预备 课程 列表 ) ”提交 





图 20-3 不 保持 隔离 性 的 事务 也 不 保持 原子 性 的 调度 


并 发 执行 将 原子 性 复杂 化 。 在 图 20-3 中 ， 事 务 T! 是 从 courses 中 删除 预备 课程 course}; ，Ti 先 
把 新 的 预备 课程 列表 通过 w (prereq: new_list) 操作 写 人 数据 库 中 ， 新 列表 被 注册 事务 T> 读 取 ， 
基于 新 列表 ， 学 生 注册 成 功 完成 。 但 在 T 提 交 后 ，Ti 转 入 蜡 常 中 止 状态 ， 旧 列表 被 恢复 。 学 
生 没 有 学 完 课程 course1 就 成 功 注册 course; 的 事实 (违反 完整 性 约束 IC1) 表 明 : SETER RIE, 
但 它 已 经 产生 影响 ， 因 而 T, 的 执行 是 不 保持 原子 性 的 。 

以 上 例子 说 明 ， 我 们 必须 为 事务 的 并 发 执行 指定 相应 的 约束 ， 以 便 保持 一 致 性 又 保持 原 
子 性 。 这 样 的 约束 就 是 : l 

隔离 性 (isolation) 尽管 事务 是 并 发 执行 的 ， 但 并 发 调度 执行 的 结果 就 像 训 务 按 革 

种 顺序 事 行 执行 时 所 产生 的 结果 一 样 。 

这 一 要 求 的 确切 含义 我 们 将 在 第 23 章 和 第 24 章 更 加 详细 地 盖 述 。 显 然 ， 如 果 事 务 是 一 致 
性 的 ， 并 且 事务 在 并 发 调度 时 所 产生 的 结果 与 按照 某 种 师 序 串 行 调度 所 产生 的 结果 一 样 ， 我 
们 就 说 并 发 事务 保持 一 致 性 。 满 星 这 一 条 件 的 并 发 调度 称 为 是 可 串 行 化 的 (serializable)。 

注意 ， 常 规 操作 系统 通常 不 保证 隔离 性 。 不 同 的 程序 可 能 读 写 由 文件 系统 维护 的 共享 文 
件 ， 由 于 操作 系统 对 读 写 操作 的 顺序 不 加 任何 约束 ， 所 以 程序 并 发 执行 时 不 能 保证 隔离 性 。 


20.5 事务 的 ACID 性 质 


区 分 事务 和 一 BERENS ACID [Haerder MReuter 1983] 特性 ， 即 我 们 前 面 
所 讨论 的 事务 特性 。 

原子 性 每 个 事务 要 么 执行 完成 ， 要 么 不 执行 。 

一 致 性 ”一 个 事务 的 独立 执行 将 保持 数据 库 的 一 致 性 ， 数 据 库 的 新 状态 是 企业 新 状态 的 
反映 。 
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隔离 性 一 个 事务 集 并 发 执行 所 产生 的 结果 与 这 些 事务 串 行 执行 所 产生 的 结果 一 样 。 

持久 性 提交 事务 的 结果 永久 地 保留 在 数据 库 中。 

设计 出 一 致 性 的 事务 是 事务 设计 者 的 工作 。 假 设 TP 监视 器 提供 原子 性 、 隔 离 性 和 持久 性 
的 抽象 。 这 一 假设 大 大 简化 了 设计 者 的 设计 任务 ， 因 为 它 不 必 考 虑 事务 的 异常 中 止 和 并 发 执 
行 。 保 证 事务 的 原子 性 、 隔 离 性 和 持久 性 是 TP 监视 器 的 职责 。 在 下 列 情况 下 ， 系 统 保证 每 一 
个 调度 都 将 使 数据 库 处 于 一 致 性 的 状态 : 


当 事 务 满足 ACID 性 质 时 ， 事 务 处 理 系统 保证 数据 靡 处 于 一 种 正确 、 一 致 和 实时 反映 
真实 世界 的 状态 ， 提 供给 用 户 的 数据 是 正确 和 实时 更 新 的 。 


许多 应 用 程序 要 求 保证 正确 性 ， 例 如 在 线 的 世界 范围 的 货币 交易 系统 ， 它 必须 始终 提供 
正确 的 服务 ， 因 为 随时 都 有 可 能 遭受 千 百 亿 的 金钱 损失 。 

真实 世界 中 的 ACID 性 质 

在 后 续 的 几 章 中 ， 我 们 将 阐述 实现 原子 性 、 隔 离 性 和 持久 性 可 能 使 系统 性 能 受到 影响 。 
例如 : 

。 实 现 隔离 性 时 要 求 事务 对 它 所 要 访问 的 数据 项 加 锁 。 在 释放 锁 之 前 ， 阻 止 其 他 事务 访问 

该 数据 项 。 长 期 封锁 导致 长 期 等 待 ， 因 而 使 系统 性 能 遭受 损失 。 

。 原 子 性 和 持久 性 通常 是 通过 维护 更 新 操作 的 日 志 来 实现 的 ， 日志 维 护 是 需要 开销 的 。 

。 分 布 式 事务 的 原子 性 要 求 事务 要 么 在 所 有 地 点 的 计算 机 上 都 成 功 提交 ， 要 么 在 所 有 地 点 

的 计算 机 上 都 异常 中 止 。 所 以 当 事 务 在 一 个 地 点 的 计算 机 上 执行 完 后 不 会 单独 提交 ， 而 

是 要 等 到 所 有 其 他 地 点 的 计算 机 上 的 事务 都 执行 完成 后 才 提 交 。 在 事务 提交 前 ， 锁 必须 

保持 ， 这 可 能 导致 长 时 间 等 待 。 

虽然 事务 的 ACID 性 质 的 实现 会 给 性 能 带 来 损失 ， 但 许多 应 用 处 理 的 事务 在 执行 时 还 是 
设计 成 遵循 ACID 性 质 的 。 对 某 些 应 用 来 说 ， 有 些 性 能 损失 是 无 法 接受 的 ， 如 系统 无 法 获得 
期 望 的 吞吐 量 和 响应 时 间 。 在 这 种 情况 下 ， 经 常生 性 隔 离 性 从 而 减弱 ACID 性 质 来 提升 性 能 。 
例如 : 

。 有 些 应 用 并 不 要 求 获 得 真实 世界 的 准确 信息 ， 例 如 ， 一 个 全 球 供应 链 决策 支持 系统 ， 可 

能 允许 仓储 经 理 获得 每 个 仓库 的 库存 信息 ， 这 些 信息 对 决定 何 时 购买 额外 商品 是 很 有 价 

值 的 。 在 事务 完全 隔离 的 状态 下 ， 系 统 产 生 所 有 仓库 库存 的 一 个 瞬时 快照 ， 经 理 们 可 以 

根据 这 一 大 致 的 快照 做 出 购买 决定 ， BERRET, 某 些 仓储 的 库存 报表 已 经 在 一 小 时 前 

更 新 过 或 一 些 仓库 根本 没有 提供 它们 的 库存 清单 。 

。 有 些 事 务 处 理应 用 必须 为 真实 世界 准确 建 模 ， 即使 事务 不 是 完全 隔离 的 ， 也 要 求 正确 

: 执行 。 完 全 隔离 是 确保 任何 应 用 正确 执行 的 充分 条 件 ， 但 不 是 必要 条 件 。 因 为 有 些 应 

用 虽然 为 真实 世界 准确 建 模 ， 但 事务 并 不 是 隔离 的 〈 我 们 将 在 24.2.2 节 给 出 这 样 的 应 用 

实例 )。 : 

为 改进 这 类 应 用 执行 的 性 能 ， 大 多 数 商业 系统 减弱 了 隔离 性 级 别 ， 不 保证 可 串 行 化 的 调 
度 。 随 后 几 章 将 探讨 这 些 问 题 。 基 于 以 上 考虑 ， 设 计 者 应 该 决定 应 用 是 否 要 保持 ACID 性 质 ， 
以 及 是 否 负担 得 起 保持 ACID 性 质 的 代价 。 
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20.6 参考 书目 


关于 事务 及 其 实现 的 精彩 描述 在 [Gray and Reuter 1993], [Lynch et al 1994,and Bernstein and 


Newcomer 1997] 中 可 以 找到 。 术 语 ACID 在 [Haerder and Reuter 1983] 中 给 出 ， 但 ACID 性 质 的 各 个 部 分 
在 早期 的 论文 中 就 有 介绍 ， 例 如 [Gray et al. 1976], [Eswaran et al. 1976]. 


20.7 练习 


20.1 


20.4 


20.5 


20.6 


20.7 


20.8 


一 些 分 布 式 事务 处 理 系统 在 两 个 或 两 个 以 上 地 理 上 分 开 的 地 点 复制 数据 。 通 常 的 做 法 是 事务 更 新 一 

个 场地 的 数据 时 也 必须 更 新 所 有 场地 的 数据 。 因 此 ， 在 这 样 一 个 备份 系统 中 ， 可 能 的 完整 性 约束 就 

是 所 有 场地 的 数据 必须 保持 完全 相同 。 试 解释 ， 在 这 样 一 个 系统 上 运行 时 ， 事 务 怎样 才 会 违反 : 

a. 原子 性 

b. 一 致 性 

c. 隔离 性 

d. 持久 性 

考虑 上 题 所 描述 的 复制 存储 系统 。 

a 复制 存 储 系统 对 只 读 事 务 的 性 能 有 什么 影响 ? ， 

b 复制 存储 系统 对 有 读 写 操作 要 求 的 事务 的 性 能 有 什么 影响 ? 

c .复制 存储 系统 对 通信 系统 有 什么 影响 ? 

试 举 出 三 个 除 自 动 取款 机 取款 事务 之 外 的 例子 ， 要 求 当 且 仅 当 事务 提交 时 ， 真实 世界 中 的 事件 才 

发 生 。 

学 生 注册 系统 模式 包括 当前 注册 的 人 数 和 每 门 课程 已 注册 学 生 的 列表 。- 

a. 数据 有 哪些 完整 性 约束 ? 

b. 非 原子 性 的 注册 事务 在 什么 情况 下 会 违反 这 一 约束 ? 

c. 假设 系统 执行 一 个 事务 显示 一 门 课程 的 当前 信息 。 试 给 出 一 个 非 隔 离 性 的 调度 ， 其 中 ， 事 务 显 
示 不 一 致 的 信息 。 

试 举 出 三 个 应 用 实例 ， 其 中 特定 事务 不 是 完全 隔离 的 ， 尽 管 不 是 可 申 行 化 调度 的 结果 ， 但 返回 的 

结果 足以 满足 应 用 的 需要 。 

试 描述 程序 在 本 地 操作 系统 上 执行 时 分 别 不 满足 以 下 三 种 性 质 的 情形 。 

a. 原子 性 

b. 隔离 性 

c. 持久 性 

某 天 中 午 12 点 时 ， 有 100 人 同时 从 某 银行 的 100 台 自动 取款 机 前 从 他 们 各 自 的 账户 上 提取 现金 。 假 

设 事 务 是 顺序 执行 的 ， 每 个 事务 花费 0.25 秒 的 时 间 进 行 计算 和 输入 输出 ， 试 估计 执行 完 100 个 事务 

需要 多 长 时 间 ， 对 这 100 名 顾客 的 平均 响应 时 间 是 多 少 ? 

你 可 以 选择 执行 单个 事务 将 300 元 钱 从 同一 银行 的 一 个 账户 转移 到 另 一 个 账户 上 ， 也 可 以 运行 两 个 

事务 ， 其 中 一 个 事务 从 账户 上 了 到 300 元 钱 ， 另 一 个 事务 再 将 这 300 元 钱 存 人 另外 的 账户 。 在 第 一 种 

选择 中 ， 传 输 是 原子 性 的 ， 而 第 二 种 方法 中 的 传输 不 是 原子 性 的 。 试 描述 一 种 在 传输 后 ， 在 传输 

完成 的 那 一 瞬 间 两 个 账户 的 余额 不 同 的 情形 (和 两 个 事务 开始 执行 时 比较 )。 提 示 : 在 资金 传输 时 ， 

同时 可 能 还 执行 其 他 事务 。 
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在 学 生 注册 系统 中 ， 所 有 的 事务 都 是 短 事务 ， 且 只 对 单个 数据 库 服 务 器 中 存储 的 数据 有 
少量 的 访问 ， 但 多 数 应 用 与 长 事务 有 关 ， 这 些 长 事务 涉及 对 多 个 数据 库 的 访问 。 例 如 ， 一 个 
学 生 缴 费 系 统 中 的 事务 可 能 要 处 理 一 个 大 学 里 10 000 名 学 生 的 学 费 和 房租 。 在 真正 的 大 系统 
中 ， 事 务 可 能 要 访问 一 个 网 络 中 存储 在 不 同 地 点 的 多 个 数据 库 服务 器 上 的 数 百 万 条 记录 。 为 
处 理 这样 的 长 而 且 复杂 的 事务 ， 许 多 事务 处 理 系统 引入 相关 机 制 ， 给 事务 强加 某 种 结构 ， 或 
把 一 个 任务 分 解 成 多 个 相关 事务 .这 一 章 中 ， 我 们 从 应 用 设计 者 的 角度 来 介绍 这 些 事务 的 结 
构 机 制 。 在 后 续 几 章 ， 我 们 将 阐述 这 些 机 制 的 实现 。 


21.1 平坦 事务 


我 们 所 讨论 的 事务 模型 仅 涉及 单个 服务 器 上 的 单个 数据 库 ， 这 种 事务 模型 没有 内 部 结构 ， 
我 们 称 之 为 平坦 事务 (flat transaction)。 其 形式 如 下 : 


begin_transaction(); 
S; 


commit (); 


在 这 里 ， 我 们 介绍 begin_transaction() 语 句 。 你 可 能 还 记得 ， 在 10.2.3 节 我 们 所 讨论 的 事务 
中 ，SQL-92 标 准 里 没有 这 样 的 语句 (一 个 事务 必须 在 它 的 前 一 个 事务 结束 后 才 开 始 执 行 )。 在 
本 节 及 其 后 续 部 分 ， 我 们 对 事务 作 更 加 详细 的 介绍 。 对 事务 的 抽象 作 清晰 的 描述 是 有 益 的 ， 
为 此 ， 我 们 使 用 新 的 语法 。begin_transaction() 语 句 通 知 数据 库 管 理 系 统 ， 有 一 个 新 的 事务 开 
始 ， 后 续 的 SQL 语句 包含 在 S 部 分 。 

事务 在 使 用 局 部 变量 进行 计算 和 执行 SQL 语句 二 者 之 间 交 替 进 行 ， 这 些 语 句 使 得 数据 和 状 
态 信息 在 数据 库 和 局 部 变量 之 间 得 以 传递 ， 包 括 SQL 语 名 和 描述 符 中 的 输入 输出 参数 。 在 这 个 
简单 的 模型 中 ， 我 们 假设 事务 只 访问 一 个 数据 库 管理 系统 。 计 算 完成 时 ， 事 务 要 求 服务 器 提 
交 或 撤销 事务 对 数据 库 所 作 的 修改 。 数 据 库 管 理 系统 保证 事务 的 原子 性 、 隔 离 性 和 持久 性 。 

为 理解 这 一 模型 的 局 限 性 ， 考 虑 以 下 几 种 情形 。 

1) 设想 一 个 旅行 计划 事务 必须 为 某 次 旅行 预定 从 伦敦 到 得 梅 因 的 航班 ,可 以 采取 以 下 策略 : 
先 预订 从 伦敦 到 纽约 的 航班 ， 然 后 预订 从 纽约 到 芝加哥 的 航班 ， 最 后 预订 从 芝加哥 到 得 梅 因 的 
航班 。 现 在 假设 已 经 预订 好 前 两 个 航班 ， 但 发 现 从 芝加哥 去 得 梅 因 的 航班 已 经 没有 座位 。 事 务 
可 能 决定 放弃 预订 从 纽约 去 芝加哥 的 航班 ， 而 选择 从 纽约 去 圣 路 易 ， 然 后 再 去 得 梅 因 。 

设计 这 样 一 个 事务 有 几 种 选择 ， 当 预订 从 芝加哥 到 得 梅 因 的 航班 失败 时 ， 事 务 可 能 异常 
中 止 ， 下 一 个 事务 选择 经 过 圣 路 易 的 路 线 。 这 样 设计 的 困难 在 于 ， 从 伦敦 到 纽约 航班 的 预订 
结果 将 丢失 ， 下 一 个 事务 发 现 从 伦敦 到 纽约 的 航班 已 没有 座位 。 另 一 个 方法 是 事务 取消 从 纽 
约 到 芝加哥 的 航班 预订 ， 修 改 为 经 圣 路 易 的 路 线 。 若 该 方法 可 行 ， 就 需要 撤销 以 前 的 操作 ， 





其 代码 相当 复杂 。 而 且 ， 看 起 来 这 个 事务 处 理 系统 还 要 能 够 提供 一 个 撤销 某 些 操作 的 机 制 。 
系统 中 已 经 提供 完全 回 退 的 操作 ， 这 里 需要 的 是 部 分 回 退 。 

2) 由 于 得 梅 因 没有 国际 航班 ， 我 们 的 旅客 必须 在 菜 个 地 方 换 机 ， 可 能 要 预订 旅馆 和 汽车 。 
因此 事务 不 得 不 访问 分 布 在 金 世界 各 数据 库 服 务 器 上 的 多 个 数据 库 。 尽 管 涉 及 多 个 数据 库 服 
务 器 ， 但 我 们 还 是 希望 事务 保持 ACID 性 质 。 例 如 ， 假 设 我 们 已 经 成 功 预 订 到 一 个 国际 航班 ， 
但 维护 航线 的 数据 库 的 服务 器 崩溃 〈 这 样 无 法 安排 一 次 完整 的 旅行 )， 我 们 需要 取消 预订 。 通 
常 ， 要 应 用 新 技术 来 保证 访问 多 个 服务 器 的 事务 的 原子 性 、 隔 离 性 和 持久 性 。 

3) 安排 一 次 旅行 不 仅 包括 必要 的 预订 ， 而 且 还 包括 票据 的 打印 和 邮寄 。 这 些 工作 必须 完 
成 ， 但 不 必 同 时 完成 ， 因 为 一 些 工作 要 求 机 械 操 作 和 人 工 于 预 。 所 以 事务 操作 可 能 在 时 间 上 
扩展 ， 正 和 在 空间 上 扩展 一 样 。 允 许 一 个 事务 创建 其 他 事务 的 模型 是 有 意义 的 ， 这 些 新 创建 
的 事务 可 以 在 以 后 的 某 个 时 间 里 执行 。 更 一 般 地 ， 一 个 模型 应 该 能 描述 整个 企业 的 活动 ， 涉 
及 不 同 地 点 和 不 同时 间 里 由 计算 机 和 人 共同 完成 的 多 个 相关 工作 。 

4) 银行 在 每 季度 末 付 利息 。 一 种 办 法 是 为 每 个 账户 执行 一 个 事务 ， 更 新 余额 和 其 他 与 账 
户 相关 的 信息 。 如 果 有 10 000 个 账户 ， 则 必须 执行 10 000 个 事务 。 这 种 做 法 的 问题 在 于 数据 库 
在 两 个 连续 事务 之 间 会 处 于 一 种 不 一 致 的 状态 ， 在 一 些 账户 上 已 计 入 利息 而 其 他 账户 却 没有 
计 人 利息 。 如 果 这 时 审计 员 运 行 一 个 事务 统计 所 有 账户 的 余额 ， 总 额 将 是 一 个 毫 无 意义 的 数 
字 。 较 好 的 办 法 是 在 一 个 事务 中 计算 所 有 账户 的 利息 。 假 设 这 是 由 平坦 事务 完成 的 ， 在 事务 
为 前 9000 个 账户 计 息 后 ， 系 统 崩 省。 由 于 事务 异常 中 止 ， 前 面 所 有 计算 结果 丢失 ， 这 就 需要 
一 个 即使 在 系统 崩溃 时 也 能 保存 部 分 结果 的 事务 模型 。 

下 一 节 给 出 解决 这 类 问题 及 与 其 相关 问题 的 事务 模型 。 


21.2 提供 事务 的 结构 

由 平坦 事务 的 介绍 可 知 ， 应 用 设计 者 必须 在 全 做 或 全 不 做 之 间 做 出 选择 : 运用 平坦 事务 
达到 原子 性 、 隔 离 性 和 持久 性 ， 或 设计 一 个 不 依赖 于 以 上 任何 性 质 的 应 用 程序 。 在 本 章 后 面 
的 部 分 (和 后 续 几 章 )， 我 们 将 描述 一 个 可 以 更 好 地 获得 原子 性 、 隔 离 性 和 持久 性 的 事务 模型 
和 机 制 ， 使 原子 性 、 隔 离 性 和 持久 性 在 不 同 程度 上 得 以 满足 。 这 种 灵活 性 是 在 事务 内 部 引入 

结构 而 获得 的 。 结 构 化 意味 着 分 解 ， 即 一 个 事务 分 解 成 以 各 种 方式 相互 关联 的 不 同 部 分 。 在 
某 些 情况 下 ， 事 务 的 内 部 结构 对 其 他 事务 是 不 可 见 的 。 在 另外 一 些 情 况 下 ， 事务 ACID 性 质 中 
的 隔离 性 被 违反 。 

在 本 节 中 , 我 们 描述 把 事务 看 作 是 单一 的 、 紧密 集成 在 一 起 的 工作 单元 的 模型 在 21.3 节 ， 
我 们 描述 应 用 中 子 任务 是 松散 连接 的 模型 。 


21.2.1 存储 点 


一 般 来 说 ,数据库 提供 存储 点 (savepoint) [Astrahan et al.1976]， 是 部 分 事务 要 回 退 到 的 
事务 中 的 一 点 。 存 储 点 用 来 标记 事务 在 执行 过 程 中 某 个 特殊 的 点 ， 一 个 事务 可 以 定义 多 个 不 
同 的 存储 点 ， 它 们 是 按 数字 顺序 标记 的 ， 以 便于 区 分 ， 使 以 后 的 事务 能 引用 某 个 特定 的 点 。 
存储 点 通过 对 服务 器 的 调用 来 创建 ， 如 


Sp := create_savepoint() 
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在 返回 值 的 地 方 创建 存储 点 标记 。 有 多 个 存储 点 的 事务 形式 如 下 : 


begin_transaction(); 
513 
spl := create _savepoint(); 
S3; 
sp2 := create_savepoint(); 


Sai 
spn := create_savepoint(); 


if (condition) { 
rollback(spi) ; 


} 


commit (); 


一 个 事务 能 通过 发 出 rollback(sp) 请 求 回 退 到 先前 创建 的 某 个 存储 点 处 。 这 里 变量 sp 包含 
目标 存储 点 的 标记 。 


回 退 意味 着 被 事务 访问 过 的 数据 库 项 的 值 (或 称 为 数据 库 上 下 文 (database context)) 返 
回 到 创建 存储 点 时 的 状态 ， 事 务 撤销 自 存储 点 后 对 数据 库 所 作 的 任何 修改 。 事 务 从 回 退 语句 
之 后 的 语句 处 继续 执行 (不 是 create_savepoint( 之 后 的 语句 )。 

例如 ， 旅 行 计划 事务 可 能 在 完成 每 个 单独 的 航班 预订 后 ， 创 建 一 个 存储 点 。 当 发 现 从 芝 
加 哥 到 得 梅 因 的 航班 没有 座位 时 ， 事 务 就 回 退 到 预订 完 从 伦敦 到 芝加哥 航班 后 创建 的 存储 点 
处 ， 从 数据 库 中 撤销 预订 纽约 到 芝加哥 航班 时 所 做 的 修改 。 其 结果 就 好 像 事务 从 来 没有 想 让 
旅客 途经 芝加哥 一 样 。 在 23.7.1 节 ， 我 们 将 讨论 存储 点 的 实现 (特别 是 如 何 维护 隔离 性 )。 

注意 ， 尽 管 数 据 库 返回 到 创建 存储 点 时 的 状态 ， 但 事务 的 局 部 变量 的 状态 并 没有 因 事 务 
的 回 退 而 改变 ( 即 它们 没有 被 回 退 )。 因 此 这 些 局 部 变量 的 值 可 能 受到 影响 ， 因 为 在 存储 点 创 
建 后 ， 它 们 可 能 读 取 数 据 库 中 数据 项 的 值 。 例 如 ， 一 个 事务 在 创建 存储 点 后 读数 据 库 中 数据 
项 x 的 值 ， 将 x 的 值 保存 在 局 部 变量 x1 中 ， 然 后 计算 新 的 局 部 变量 x2 的 值 、 并 将 该 值 写 回 x 中 ， 
如 果 后 来 事务 回 退 到 存储 点 ，x 恢 复 为 最 初 的 值 ，x1 是 当前 x 的 值 ，x2 的 值 不 再 在 数据 库 中 ， 
x1 和 x2 的 值 可 能 影响 到 以 后 事务 的 执行 。 这 意味 着 回 退 到 存储 点 给 我 们 一 种 从 存储 点 到 回 退 
点 会 对 事务 的 执行 产生 影响 的 假象 。 实 际 上 ， 这 种 假象 通常 与 实际 是 不 符 的 ， 这 里 重 做 同样 
的 计算 没有 任何 意义 。 事 务 只 需 知道 回 退 操作 已 经 发 生 ， 以 后 采取 不 同 的 执行 路 径 。 

注意 ， 数 据 库 在 存储 点 的 状态 不 是 持久 的 。 如 果 事 务 异 常 中 止 或 系统 崩溃 ， 数 据 库 返 回 
到 事务 开始 执行 时 的 状态 。 尽 管 在 某 种 意义 上 ， 事 务 异 常 中 止 可 以 看 作 回 退 到 初始 存储 点 
(没有 明确 定义 ), 事务 异常 中 止 和 事务 回 退 到 一 个 存储 点 有 重要 的 区 别 : 异常 中 止 的 事务 在 
执行 中 止 后 不 可 能 继续 执行 ， 而 回 退 到 存储 点 的 事务 能 继续 执行 。 

同样 ， 在 事务 执行 回 退 语句 rollback(sp) 后 ， 所 有 在 sp, 之 后 ， 回 退 之 前 创建 的 存储 点 都 是 
不 可 访问 的 ， 因 为 在 以 后 的 计算 中 回 退 到 这 些 存 储 点 没有 任何 意义 。 


21.2.2 分 布 式 事务 
许多 事务 处 理应 用 的 演化 方式 非常 相似 。 多 年 来 ， 企 业 致 力 于 开发 使 某 些 活动 自动 完成 
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的 专用 事务 处 理 系 统 ， 这 些 活动 包括 编制 存货 清单 、 账 单 处 理 和 工资 核算 等 。 这 样 的 系统 可 
能 由 不 同 的 集团 在 不 同 的 时 间 、 不 同 的 地 点 ， 使 用 不 同 的 硬件 和 软件 平台 以 及 不 同 的 数据 库 
管理 系统 单独 开发 出 来 的 。 每 个 事务 处 理 系统 导出 一 个 事务 集 7， (可 能 是 存储 过 程 )。 在 大 多 
数 情况 下 ， 这 些 系统 运行 多 年 并 且 很 可 靠 ， 因 此 ， 管理 人 员 不 允许 对 其 进行 9 任何 修改 。 

随 着 自动 化 要 求 的 增加 ,企业 发 现 ， 有 必要 把 这 些 系统 集成 在 一 起 ， 以 完成 更 加 复杂 的 
活动 。 在 这 里 ， 这 些 系统 被 称 作 遗留 系统 (legacy system ) ， 因 为 它们 被 当 作 完整 的 、 不 可 修 
改 的 单元 ， 供 应 用 设计 者 建造 更 大 的 系统 。 同 样 ， 系统 中 的 事务 也 称 作 遗 留 事 务 (legacy 
transaction)。 通 常 ， 遗留 系统 的 特性 使 得 在 用 它们 来 集成 大 系统 时 是 比较 困难 的 。 

例如 ， 库存 系统 和 账单 系统 可 作为 构建 自动 销售 系统 的 组 件 。 如 果 服 务 器 位 于 不 同 的 计 
算 机 上 ， 集成 的 第 一 步 就 是 通过 网 络 连接 各 个 不 同 的 站 点 。 在 一 些 网 络 站 点 上 ， 这 样 一 个 系 
统 上 的 事务 开始 执行 时 ， 可 能 通过 启动 遗留 事务 访问 多 个 事务 处 理 系 统 。 尽管 可 能 所 有 的 个 
人 系统 都 驻 留 在 同一 机 器 上 ， 但 通常 实际 情况 不 是 这 样 。 我 们 把 这 样 的 事务 称 为 分 布 式 事务 
(distributed transaction) 或 全 局 事务 ( global transaction), 

上 述 情况 在 图 21-1 中 说 明 ， 该 图 显示 了 管理 分 布 式 事务 的 新 语法 。 该 语法 是 基于 X/Open 
标准 的 ， 我 们 将 在 22.3.1 节 讨论 这 个 标准 。 和 begin_transaction() 相 比 ，tx2begin() 不 是 对 某 数 
据 库 服务 器 的 调用 ， 而 是 TP 监控 器 API 的 一 部 分 ， TP 监控 器 控制 整个 事务 处 理 系 统 。 


tx_begin(); 


execute T, 





execute T, 
execute T; 


tx_comit(); 





站 点 A 
图 21-1 分 布 式 事务 在 多 个 服务 站 点 调用 遗留 事务 


我 们 应 该 了 解 用 这 种 方法 构造 分 布 式 事务 的 优点 。 事 务 把 账单 和 库存 看 作 种 抽象 ” 它 
的 逻辑 专注 于 集成 遗留 事务 产生 的 结果 ， 而 不 考虑 本 地 数据 库 模 式 ， 不 考虑 记 账 和 库存 过 各 
的 处 理 细节 ， 以 及 每 个 站 点 的 如 原子 性 、 并 发 性 和 持久 性 等 问题 . 

例如 ， 一 个 公司 可 能 在 不 同 的 地 点 有 多 个 仓库 。 对 每 一 个 仓库 ， 都 有 个 事务 处 理 系 统 
为 控制 库存 维护 本 地 数据 库 。 公 司 的 总 裁 可 能 想 在 总 部 (图 21.1 中 的 站 点 A) HAG grag p 
生 所 有 仓库 的 库存 信息 ,这 个 事务 导 至 遗留 事务 (图 中 的 T,、T,、T,) 在 每 个 仓库 【图 中 的 
HAB, C, D) 执行 以 收集 库存 信息 。 每 个 进 留 事务 将 其 结果 返回 给 总 部 的 事务 ， 由 它 来信 
成 信息 并 产生 报表 。 





© 在 其 些 极端 情况 下 ， 由 于 原来 执行 特定 事务 的 人 离开 公司 很 入 了， 相应 的 文档 已 不 存在 ， 没 有 人 还 能 天 名 
事务 是 怎样 工作 的 。 
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分 布 式 事务 处 理应 用 也 可 以 从 头 开始 构造 ， 而 不 是 由 遗留 系统 集成 。 一 种 可 能 就 是 整个 
分 布 式 事务 位 于 一 个 地 点 ， 它 建立 几 个 数据 库 管理 系统 之 间 的 连接 ， 代 入 SQL 语句 ， 然 后 这 
些 SQL 语 名 被 送 到 这 些 服 务 器 上 执行 。 在 这 种 情况 下 ， 一 个 服务 器 上 的 子 事务 就 是 它 执行 的 
SQL 语句 集 。 

通常 ， 一 个 分 布 式 事务 涉及 网 络 上 不 同 地 点 的 服务 器 上 执行 的 子 事务 集 。 服 务 器 可 以 提 
供 除 数据 库 (如 文件 ) 之 外 对 其 他 资源 的 访问 。 对 它 所 访问 的 服务 器 而 言 ， 每 一 个 子 事务 是 
一 个 事务 ， 因 而 保持 ACID 性 质 。 如 果 这 些 服务 器 是 数据 库 系统 ， 那 么 我 们 说 分 布 式 事务 在 多 
数据 库 系 统 之 上 执行 。 多 数据 库 (multidatabase) ( 有 时 也 称 为 联邦 数据 库 (federated 
database)) 是 包含 相关 信息 的 数据 库 的 松散 联合 。 

我 们 假设 ， 各 个 站 点 的 数据 库 ( 称 为 本 地 数据 库 ) 满足 局 部 完整 性 约束 (local integrity 
constraint)。 因 为 每 个 站 点 保持 原子 性 和 隔离 性 ， 所 以 多 个 分 布 式 事务 的 子 事务 在 那些 站 点 并 
发 执行 时 ， 它 们 是 满足 约束 的 。 另 外 ， 多 数据 库 ( 由 所 有 本 地 数据 库 组 成 ) 会 有 与 各 站 点 数 
据 相 关 的 全 局 完整 性 约束 (global integrity constraint)。 我 们 假设 一 个 分 布 式 事务 是 全 局 一 致 
和 的， 因此 在 它 隔离 执行 时 ， 也 满足 这 些 约束 。 

作为 全 局 完整 性 约束 的 一 个 例子 ， 假 设 一 个 银行 维护 各 分 行 的 本 地 数据 库 ， 每 一 个 数据 
库 中 含有 该 分 行 的 全 部 财产 数据 。 银 行 同时 在 总 行 维护 着 一 个 数据 库 。 总 行 数据 库 中 含有 银 
行 的 总 的 财产 数据 。 该 银行 的 全 局 完整 性 约束 可 能 是 总 行 的 全 部 财产 数据 必须 是 各 分 行 中 财 
产 数据 之 和 。 注 意 ， 这 一 约束 不 是 由 各 个 子 事务 维护 的 。 在 一 个 分 行 存款 ， 则 在 该 分 行 的 数 
据 库 上 启动 一 个 子 事务 增加 该 分 行 的 财产 值 ， 而 不 是 总 行 的 财产 值 。 为 保持 全 局 完整 性 约束 ， 
分 行 的 存款 子 事务 必须 伴随 着 总 行 的 一 个 子 事务 ， 在 总 财产 值 中 增加 同样 的 值 。 

除 全 局 一 致 性 外 ，TP 监 控 器 的 另 一 个 目标 是 确保 每 一 个 分 布 式 事务 (包括 它 所 有 的 子 事 
务 ) 是 原子 性 、 隔 离 性 和 持久 性 的 。 

。 一 个 分 布 式 事务 的 原子 性 表明 它 的 每 一 个 子 事务 在 其 所 访问 的 服务 器 上 是 原子 性 的 ， 还 

意味 着 要 么 提交 全 部 子 事务 ， 要 么 异常 中 止 全 部 子 事务 。 因 此 ， 当 分 布 式 事务 T 中 的 一 

个 子 事务 完成 操作 后 不 能 立即 提交 ,因为 T 事 务 的 其 他 子 事务 可 能 异常 中 止 (在 这 种 情 

形 下 ，T 事 务 的 所 有 子 事务 也 必须 异常 中 止 )。 我们 把 这 种 要 么 都 提交 要 么 都 不 提交 的 特 

性 称 作 全 局 原子 性 (global atomicity). 

。 事 务 的 隔离 性 不 仅 表 明 每 一 个 子 事务 在 其 所 执行 的 服务 器 上 是 隔离 的 ( 即 每 一 台 服 务 器 

串 行 化 其 上 执行 的 所 有 子 事 务 )， 而 且 表 明 每 一 个 分 布 式 事务 相对 于 其 他 事务 来 说 也 是 

隔离 的 ( 即 这 里 存在 所 有 分 布 式 事务 的 一 些 人 局 串 行 化 序列 )。 因 此 ， 全 局 串 行 化 

(global serializability ) 表示 ， 分 布 式 事务 Ti 和 T: 的 子 事务 在 所 有 服务 器 上 以 这 样 一 种 方 

式 执行 ， 卫 的 所 有 子 事务 先 于 T: 的 子 事务 执行 ， 或 者 T: 的 所 有 子 事务 先 于 Ti 的 所 有 子 事 

务 执行 。 . | 

。 分布 式 事务 的 持久 性 表明 它 的 所 有 子 事务 也 是 持久 性 的 。 

全 局 原子 性 和 隔离 性 足以 保证 ， 分 布 式 事务 集 并 发 执行 所 产生 的 结果 与 它们 按 某 一 串 行 
方式 执行 所 产生 的 结果 一 样 。 因 此 ， 我 们 可 以 认为 ， 作 为 一 个 整体 的 每 一 个 分 布 式 事务 的 一 
致 性 和 可 串 行 化 表明 ， 分 布 式 事务 的 并 发 调度 是 正确 的 。 稍 后 ， 我 们 将 讨论 不 同 模型 ， 这 些 
模型 中 的 事务 不 一 定 满足 全 局 原子 性 和 隔离 性 ， 其 正确 性 也 是 不 能 保证 的 。 
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分 布 式 事务 模型 

一 个 分 布 式 事务 可 以 被 看 作 一 个 树 ， 树 的 根 产生 一 个 子 事务 集 ， 每 一 个 子 事务 又 产生 一 
个 事务 集 ， 结 果 产 生 一 个 任意 深度 的 树 。 一 般 来 讲 ， 它 的 结构 有 下 面 的 一 些 选 项 。 

。 某 一 子 事务 的 孩子 可 能 或 不 能 并 发 执行 

。 子 事务 集 的 父亲 可 能 或 不 能 与 其 孩子 并 发 执行 。 若 可 以 并 发 执行 ， 父 亲 可 能 或 不 能 与 其 

孩子 通信 。 

. 在 一 些 模型 中 ， 只 有 根 能 请 求 提交 事务 。 在 其 他 一 些 事务 模型 中 ， 任 意 子 事务 可 以 请 求 

提交 事务 ， 事 务 设计 者 必须 确保 只 有 一 个 这 样 的 事务 能 提出 提交 请 求 。 还 有 一 些 事务 模 

型 ， 请 求 提交 的 权利 可 以 从 一 个 子 事务 传递 到 另 一 个 子 事务 。 

在 以 上 这 些 选 项 中 ， 可 能 存在 多 种 事务 模型 。 有 两 种 特定 的 模型 变 体 占据 着 主导 地 位 ， 
它们 被 视 为 极端 情形 的 例子 。 

(1) 层次 模型 (hierarchical model) 

事务 内 部 不 允许 并 发 执行 。 启 动 一 个 子 事务 后 ， 父 事务 必须 等 到 所 有 子 事务 都 执行 完 后 
才能 继续 执行 。 结 果 父 事务 既 不 能 产生 其 他 与 其 孩子 并 发 执行 的 子 事务 ， 也 不 能 与 其 孩子 通 
信 。 事 务 是 由 根来 提交 的 。 过 程 调 用 是 一 般 模型 内 部 通信 的 一 般 形 式 。TP 监 控 器 通常 提供 一 
种 特殊 的 过 程 调用 ， 这 种 过 程 调用 称 为 事务 远程 过 程 调用 (TRPC)， 它 除了 能 调用 过 程 ， 还 
支持 分 布 式 事务 。TRPC 将 在 22.4.1 节 讨论 这 部 分 内 容 。 . 

(2) 对 等 模型 (peer model) 

父亲 与 孩子 、 孩 子 与 孩子 之 间 可 以 并 发 执行 。 父 事务 与 其 孩子 事务 的 层次 关系 被 最 小 化 ; 
一 旦 创建 孩子 事务 ， 孩 子 与 父亲 就 处 在 同等 的 位 置 上 ， 特 别 是 父亲 能 与 其 孩子 对 等 地 进行 通 

任何 参与 者 都 可 以 提出 事务 提交 请 求 。 在 对 等 模型 中 ， 对 等 通信 (peer-to-peer 
communication) 是 常用 的 形式 。 一 对 子 事务 可 以 显 式 地 建立 连接 ， 然 后 通过 连接 发 送 和 接收 
消息 。TP 监 控 器 通常 支持 对 等 通信 ， 我 们 将 在 22.4.2 节 讨论 这 部 分 内 容 。 

最 后 ， 有 两 种 技术 通常 用 来 定义 分 布 式 事务 的 边界 ， 这 被 称 作 事务 分 界 标记 (transaction 
demarcation). 。 借 助 于 程序 分 界 标记 (programmatic demiareation ) ， 一 个 应 用 模块 通过 监视 器 
提供 的 API 函 数 ， 明 确 告 知 TP 监控 器 事务 的 开始 和 结束 。 例 如 ， 使 用 X/Open 标准 ， 应 用 程序 
调用 tx_begin0 开 始 一 个 事务 。 

声明 性 分 界 标记 (declarative demarcation) 的 目的 就 是 从 组 成 应 用 程序 的 模块 中 副 除 可 
务 边界 的 规格 说 明 。 每 一 个 这 样 的 模块 在 使 用 声明 性 分 界 标记 系统 中 称 为 一 个 组 件 
(component)， 它 只 处 理 与 应 用 相关 的 问题 ， 如 访问 数据 库 和 维护 业务 规则 ， 并 不 对 事务 执行 
的 上 下 文 进行 定义 。 使 用 组 件 的 容器 模块 (container module) 可 定义 组 件 是 否 作为 一 个 事务 
执行 。 因 此 ， 不 同 的 模块 能 决定 把 同一 个 组 件 作为 一 个 事务 ， 或 是 作为 一 个 子 事务 ， 或 是 作 
为 一 个 更 大 事务 的 非 事务 的 一 部 分 。Microsoft Transaction Server (MTS) 是 一 个 使 用 声明 性 
分 界 标 记 的 TP 监 控 器 。 E (Enterprise Java Bean) 也 提供 声 胡 性 分 界 标记 接站 所 以 使 用 
EJB 构 造 的 TP 监控 器 也 能 使 用 这 一 特性 。 


21.2.3 REES l 7 
分 布 式 事务 从 一 个 需求 发 展 而 来 ， 该 需求 就 是 将 从 多 个 服务 器 上 导出 的 事务 组 合成 一 个 
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事务 单元 。 因 为 每 一 个 服务 器 都 支持 事务 的 概念 ， 所 以 每 一 个 ( 子 ) 事务 都 能 单独 决定 是 提 
交还 是 异常 中 止 。 但 事务 设计 者 不 能 控制 分 布 式 事务 的 结构 ， 每 一 个 导出 事务 的 功能 基本 上 
是 由 数据 在 各 服务 器 上 的 分 布 方式 来 确定 的 ， 数 据 的 分 布 可 能 受 控 于 这 样 一 些 因素 ， 如 数据 
在 哪里 产生 ， 经 常 在 哪里 被 访问 等 。 由 于 采用 自 底 向 上 的 方法 ,事务 可 能 在 分 解 后 不 能 反映 
应 用 原来 的 功能 。 

因为 嵌 套 事务 没有 被 视 为 处 理 多 个 服务 器 和 分 布 式 数据 的 方法 ， 所 以 它 的 发 展 也 是 不 同 
的 。 它 的 目标 是 让 事务 设计 者 利用 自 顶 向 下 的 方式 设计 一 个 复杂 事务 。 事 务 从 功能 上 适当 地 
分 解 成 多 个 子 事务 (这 种 分 解 方式 不 是 分 布 式 数 据 专 用 的 )。 而 且 ， 与 使 用 分 布 式 模型 相同 ， 
由 子 事务 决定 提交 或 异常 中 止 ， 但 决定 的 处 理 方式 不 同 。 分 布 式 模型 使 用 要 么 全 做 或 全 不 做 
的 方法 ， 而 供 套 模型 中 单个 也 事务 能 中 途 异 常 中 止 而 不 会 使 整个 事务 都 异常 中 止 。 即 使 这 样 ， 
作为 一 个 整体 ， 伐 套 事务 仍 保持 全 局 隔离 性 和 原子 性 ， 

现在 已 经 提出 一 些 具 体 的 、 详 细 的 嵌 套 事务 模型 ， 我 们 来 看 [Moss 1985] 所 描述 的 一 个 这 
样 的 模型 。 一 个 事务 与 它 所 有 的 子 事务 被 看 作 一 棵 树 ， 树 的 根 称 为 顶层 (top-level) 事务 ， 术 
语 父 、 子 、 祖 先 、 后 代 和 兄弟 的 含义 与 平常 无 异 。 没 有 孩子 的 子 事务 称 作 叶 子 , 不 是 所 有 的 
叶子 都 处 在 同一 层 上 。 我 们 假设 事务 和 它 的 所 有 子 事务 都 在 同一 个 地 点 执行 。 

媒人 套 事务 模型 的 语义 可 以 总 结 如 下 : 

1) 父 事务 能 顺序 地 创建 孩子 事务 ,使 一 个 孩子 事务 执行 结束 后 再 开始 执行 另 一 个 孩子 事 
务 ， 它 还 能 定义 子 事务 集 并 发 执行 。 父 事务 不 能 与 孩子 事务 并 发 执行 ， 它 要 等 到 所 有 子 事务 
都 执行 完毕 后 才 开 始 执行 ， 它 还 能 创建 新 的 孩子 。 注 意图 21-2 所 描述 的 柑 套 事务 树 结构 ， 在 
图 中 并 没有 把 并 发 执行 的 子 事务 与 顺序 执行 的 子 事务 区 分 开 来 。 





图 21-2 一 个 旅游 计划 事务 的 结构 


2) 子 事务 (及 其 所 有 的 后 代 ) 相对 其 并 发 执行 的 兄弟 事务 来 说 ， 是 一 个 隔离 执行 的 单元 。 
在 图 21-2 中 ， 如 果 T> 和 Ta 并 发 执行 ， 那 么 T 把 子 树 (Ts. Ts. To) ,看 作 是 隔离 的 事务 ， 而 不 管 
其 内 部 结构 。 兄 弟 事务 集 并 发 执行 的 结果 与 它们 按照 某 种 串 行 顺序 执行 的 结果 是 一 样 的 。 因 
此 ， 兄 弟 事务 对 它们 自身 来 讲 是 可 串 行 化 的 。 

在 某 些 情形 下 ， 兄 弟 事务 串 行 化 的 顺序 影响 数据 库 最 终 状 态 。 例 如 ， 在 一 个 银行 应 用 程 
序 中 ， 两 个 并 发 的 兄弟 事务 从 同一 个 账户 提 款 ,不管 它们 的 实际 执行 顺序 如 何 ， 其 执行 结果 
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是 一 样 的 (假设 账户 的 初始 余额 允许 这 两 次 提 款 操作 )。 但 写 入 的 值 依赖 于 它们 的 执行 顺序 ， 
因此 ， 侈 套 事 务 是 不 确定 的 ， 因 为 在 不 同时 间 运 行 同 一 个 事务 会 产生 不 同 的 结果 。 但 如 果 设 
计 正 确 ， 所 有 的 结果 对 应 用 来 说 都 是 可 以 接受 的 。 

我 们 可 以 把 所 有 的 候 套 事务 看 作 是 树 结构 ,，“ 个 套 事 务 中 的 所 有 顶层 事务 的 母亲 ”是 根 ， 
所 有 的 顶层 事务 是 她 的 孩子 。 一 个 顶层 事务 (和 它 所 有 的 后 代 ) 相对 于 其 他 所 有 的 顶层 事务 
(和 它们 所 有 的 后 代 ) 来 说 ， 可 以 被 看 作 一 个 独立 执行 的 事务 单元 。 修 套 事 务 的 这 种 层次 结构 
对 事务 的 外 部 来 说 是 不 可 见 的 。 

3) 子 事务 是 原子 性 的 。 每 一 个 子 事务 不 能 独立 地 决定 是 提交 还 是 异常 中 止 。 子 事务 的 提 
交 和 持久 性 取决 于 其 父亲 事务 的 提交 。 因 此 ， 当 一 个 子 事 务 的 所 有 祖先 事务 (包括 顶层 事务 ) 
提交 时 ， 这 个 子 事务 提交 并 保持 持久 性 ， 这 时 我 们 说 整个 嵌 套 事务 被 提交 。 如 果 一 个 父亲 事 
SHE HIE, 那么 它 所 有 的 子 事务 (即使 已 经 提交 ) 也 异常 中 止 。 

4) 如 果 一 个 子 事务 异常 中 止 ， 那 么 它 的 执行 结果 就 像 对 数据 库 没有 作 任 何 操作 一 样 ， 同 
时 又 回 到 父 事务 的 状态 ， 父 事务 可 以 采取 适当 的 措施 。 这 样 一 个 异常 中 止 的 子 事务 可 能 会 改 
变 父 事务 的 执行 路 径 ， 对 数据 库 的 状态 产生 影响 。 这 和 一 般 平坦 事务 的 情形 相反 ， 一 般 事 务 
在 异常 中 止 时 是 不 产生 任何 影响 的 。 

5) 子 事务 不 一 定 保持 一 致 性 ， 但 候 套 事务 作为 一 个 整体 是 保持 一 致 性 的 。 

婴 套 事务 隔离 的 实现 比 平坦 事务 隔离 的 实现 要 复杂 ， 因 为 并 发 不 仅 可 能 发 生 在 幢 套 事务 
之 间 ， 而 且 可 能 发 生 在 嵌 套 事务 的 内 部 ， 我 们 将 在 23.7.4 节 讨论 这 个 问题 。 

下 面 我 们 用 旅游 计划 的 例子 来 阐述 媒 套 事务 的 模型 ， 事 务 的 幢 套 结构 如 图 21-2 所 示 。 

事务 Ti 预订 从 伦敦 到 得 梅 因 的 航班 。 它 可 以 创建 子 事务 T， 预 订 从 伦敦 到 纽约 的 航班 ，T。 
执行 完成 后 ， 它 又 创建 子 事务 Ts;， 预 订 从 纽约 到 得 梅 因 的 航班 。 而 T; 可 以 创建 子 事 务 Ts 和 T。， 
T: 预 订 从 纽约 到 芝加哥 航班 ，Ts 预 订 从 芝加哥 到 梅 得 因 的 航班 。T; 和 Te 可 以 定义 成 并 发 执行 的 
事务 ， 它 们 可 能 访问 共同 的 数据 (如 旅客 的 银行 账户 )， 但 它们 的 执行 是 可 串 行 化 的 。 

如 果 Te 不 能 预订 从 芝加哥 到 得 梅 因 的 航班 ， 则 异常 中 止 。 当 Ts 得 知 这 一 异常 中 止 后 就 放 
弃 经 芝加哥 的 航班 预订 ， 因 而 也 异常 中 止 ( 也 导致 它 的 另 一 个 孩子 事务 T; 异 常 中 止 ， 取 消 从 
纽约 到 芝加哥 的 航班 预订 )。 当 事务 Ti 得 知 这 一 异常 中 止 后 ， 它 就 创建 新 的 子 事务 T,， 预 订 途 
经 圣 路 易 从 纽约 到 得 梅 因 的 航班 ， 这 时 仍然 保留 从 伦敦 到 纽约 的 航班 的 预订 。 如 果 T 提 交 ， 
T, 就 能 提交 ， 它 对 数据 库 的 影响 是 事务 Ts、T4、Tr 和 Ts 事务 的 影响 之 和 。 事 务 作为 一 个 整体 相 
对 于 其 他 任 套 事务 可 看 作 隔离 的 、 原 子 性 的 单元 。 


21.2.4 多 级 事务 


多 级 事务 在 某 些 地 方 和 分 布 式 事务 及 账 套 事务 是 相似 的 。 一 个 事务 被 分 解 成 伐 套 的 子 事 
务 集 。 但 和 候 套 事务 不 同 ， 多 级 事务 的 动机 是 提高 操作 性 能 ， 目 标 是 允许 更 多 的 独立 执行 的 
事务 并 发 执行 。 为 理解 它 如 何 提高 性 能 ， 下 面 将 深入 讨论 这 一 问题 。 

隔离 通常 用 锁 来 实现 。 当 一 个 事务 访问 数据 项 时 就 对 该 数据 项 加 锁 ， 迫 使 其 他 事务 在 访 
问 这 些 项 之 前 等 待 ， 一 直到 锁 被 释放 为 止 。 这 样 可 以 防止 一 个 事务 看 到 另 一 个 事务 执行 的 中 
间 结 果 。 如 果 事务 把 锁 一 直 保 持 到 事务 提交 为 止 ， 隔 离 就 实现 了 ， 但 只 许 有 限 数量 的 事务 并 
发 ， 因 而 这 种 操作 性 能 的 提高 也 是 有 限 的 (和 串 行 执行 相 比 )。 
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多 级 事务 模型 通过 允许 多 级 事务 中 的 子 事务 在 整个 事务 提交 前 提交 ， 因 而 释放 锁 ， 使 得 
其 他 等 待 的 事务 能 较 早 地 继续 执行 ， 从 而 提高 操作 性 能 。 这 样 做 虽然 可 以 提高 操作 性 能 ， 但 
导致 一 个 多 级 事务 能 看 到 另 一 个 事务 产生 的 部 分 结果 。 相 反 ， 在 嵌 套 事务 模型 中 ， 某 个 子 事 
务 只 能 有 条 件 地 提交 ， 锁 不 被 释放 ， 一 个 嵌 套 事务 也 不 会 看 不 到 另 一 个 供 套 事务 产生 的 部 分 
结果 。 但 我 们 将 看 到 多 级 事务 的 执行 是 原子 性 的 和 隔离 性 的 。 

在 这 一 节 中 ， 我 们 基于 [Weikum 1991] 的 研究 来 讨论 多 级 事务 模型 。 我 们 将 在 23.7.5 节 讨 
论 它 的 实现 ， 从 操作 性 能 的 角度 看 ， 这 一 模型 的 优点 是 很 明显 的 。 和 似 套 事务 模型 一 样 ， 我 
们 假设 一 个 多 级 事务 的 子 事务 在 一 个 单独 的 地 点 执行 。 

1. 多 级 事务 模型 

多 级 事务 访问 数据 库 涉及 一 系列 已 定义 的 抽象 。 例 如 ， 在 最 低级 别 ， 数 据 库 可 被 看 作 是 
一 些 页 面 的 集合 ， 通 过 读 (r) MS (w) 操作 来 访问 这 些 页 面 。 在 较 高 级 别 ， 我 们 可 以 看 到 
元 组 的 抽象 ， 通 过 SQL 语句 可 访问 这 些 元 组 (这 些 抽象 级 别 通常 是 由 数据 库 管理 系统 来 提供 
的 )。 在 更 高 级 别 中 ， 我 们 可 以 看 到 面向 接口 的 应 用 程序 。 例 如 ， 在 学 生 注册 系统 中 ， 我 们 可 
以 定义 一 组 对 象 代表 课程 的 班级 ， 利 用 抽象 的 操作 将 学 生 从 一 个 班级 移动 到 另 一 个 班级 中 。 
这 些 操 作 包 括 测试 添加 操作 TestInc， 如 果 空 间 足 够 ， 有 条 件 地 增加 学 生 ; 减 操作 Dec 从 一 个 班 
级 中 将 学 生 删 除 。 

假设 在 这 一 抽象 级 别 上 ， 一 个 事务 Move(sec!，sec2) 将 一 名 学 生 从 一 个 人 数 较 多 的 班级 
sectionl 移 动 到 班级 sectionz 中 ， 该 事务 结构 如 图 21-3 所 示 。 应 用 程序 在 图 中 处 于 最 高 一 级 ， 它 
设置 事务 边界 ， 调 用 TesInc 进 行 测试 ， 并 增加 sections 中 的 学 生 人 数 。 如 果 成 功 ， 就 调用 Dec 对 
sectioni 的 学 生 人 数 做 减法 操作 。 在 级 别 L: 上 ，TesInc 是 由 一 个 程序 来 完成 的 ， 该 程序 使 用 一 
个 SELECT 语 句 来 筛选 信息 ， 以 决定 学 生 是 否 可 以 加 入 班级 section,。 用 UPDATE 语 句 来 增加 
学 生 数 。 在 级 别 L,，Dec 是 由 一 个 UPDATE 语 句 来 完成 的 ， 该 语 甸 无条件 地 对 学 生 数 进行 减 操 
作 。 我 们 假设 sectioni 和 sectionz 的 信息 分 别 存储 在 元 组 6 和 元 组 kb 中。 在 级 别 LI 上， 这 些 SQL 语 
句 是 在 读 写 数据 库 页 面 的 程序 中 实现 的 。 元 组 0 存储 在 P, 页 中 ， 元 组 bz 存储 在 P; 页 中 。 在 这 个 
例子 里 ， 我 们 忽略 索引 页 的 访问 。 


Move(sec), secz) 


L Testinc(sec,) Dec(sec,) 
Lı Sel(t,) Upd(t,) Upd(t,) 
Rd(p,) Rd(p.) — Wr(p2) Rd(pi) Wr(p,) 


时 间 一 一 > 
图 21-3 多 级 事务 模型 中 的 Move 事 务 


在 某 些 级 上 调用 的 操作 (Lo 除外 ) 可 以 视 为 这 个 级 别 下 面 的 子 事务 。 因 此 ， 在 LL 级 上 调 
用 Upd 导 致 L, 级 的 子 事务 的 执行 ，Li 的 子 事务 沿 活 Rd 和 Wr 操作 ， 它 们 都 作为 Lo 级 上 的 子 事务 
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来 执行 。 类 似 地 ，L; 级 上 的 TestInc 调 用 Li 级 上 执行 Sel 和 Upd 操 作 的 子 事务 。 

在 一 个 父子 事务 创建 孩子 子 事务 时 ， 它 要 一 直 等 到 孩子 子 事务 执行 完成 后 才能 执行 。 不 
过 ， 与 髓 套 事务 模型 相 比 ， 孩 子 子 事务 不 是 并 发 的 ， 这 意味 着 多 级 事务 是 顺序 展开 的 。 多 级 
事务 不 同 于 幅 套 事务 模型 还 有 另外 两 方面 的 原因 : 

1) 事务 树 上 所 有 叶子 子 事务 都 处 在 同一 级 别 。 

2) 只 有 叶子 子 事务 访问 数据 库 。 

2. 多 级 事务 的 提交 

提交 操作 是 多 级 事务 模型 区 别 于 冬 套 事务 模型 的 关键 所 在 ， 也 是 多 级 事务 能 提升 性 能 的 
关键 所 在 。 和 优 套 事务 模型 相 比 ， 其 子 事务 的 提交 是 无 条 件 的 。 多 级 事务 模型 中 的 任意 级 别 
上 的 子 事务 T 在 提交 时 ， 它 对 包含 它 的 数据 抽象 所 做 的 改动 对 与 它 处 于 同一 级 别 且 并 发 执行 的 
子 事务 来 讲 是 可 见 的 。 

无 条 件 提交 必须 解决 两 个 问题 ， 以 便 确 保 多 级 事务 保持 原子 性 和 隔离 性 。 

“隔离 性 ”在 整个 多 级 事务 提交 前 ， 由 一 个 子 事务 产生 的 数据 库 中 间 状 态 ， 对 与 其 并 发 执 

行 的 事务 来 讲 是 可 见 的 。 例 如 ， 在 图 21-3 中 ，sectionz 中 学 生 数 这 个 数据 项 ， 在 TesInc 提 

交 后 (在 Dec 开 始 前 )， 对 与 其 并 发 执行 的 多 级 事务 来 说 是 可 用 的 。 

事务 作为 一 个 整体 保持 完整 性 约束 ， 但 单个 子 事务 却 不 一 定 能 保持 完整 性 约束 。 因 此 ， 
只 有 在 多 级 事务 的 最 后 一 个 子 事务 提交 后 ， 我 们 才能 确信 数据 库 处 于 一 致 性 状态 。 在 图 21-3 
中 ，L: 级 上 的 两 个 子 事务 执行 期 间 ， 被 移动 的 学 生 在 section; 和 sectionz 中 都 没有 记载 。 这 就 导 
致 班级 中 的 人 数 与 课程 人 数 总 和 不 一 致 的 情形 ， 这 里 假设 课程 人 数 总 和 保存 在 其 他 表 中 。 这 
意味 着 我 们 必须 考虑 并 发 执行 的 事务 可 能 看 到 不 一 致 的 状态 这 个 问题 。 

尽管 这 个 例子 中 各 多 级 事务 可 能 出 现 相互 之 间 不 保持 隔离 性 的 情形 ( 即 一 个 事务 能 访问 
与 其 并 发 执行 的 事务 的 中 间 结 果 )， 但 多 级 事务 模型 的 实现 (将 在 23.7.5 节 介绍 ) 仍 能 确保 可 
串 行 化 。 从 这 一 意义 上 说 ， 若 事务 保持 隔离 性 ， 则 调度 的 结果 与 按照 某 种 串 行 顺序 执行 的 结 
果 一 样 。 l 

“原子 性 ”如 果 一 个 多 级 事务 必须 中 止 ， 那 么 它 对 数据 库 所 做 的 所 有 操作 都 必须 撤销 。 对 

平坦 事务 和 柳 套 事务 T 而 言 ， 这 是 没有 问题 的 。 即 使 事务 T 更 新 某 个 数据 项 +， 在 新 值 还 

没 被 其 他 并 发 事务 访问 之 前 ， 异 常 中 止 事务 T 的 一 个 办 法 就 是 将 原来 的 值 写 回 x。 这 种 方 

式 可 视 为 物理 恢复 (在 25.2.3 节 ， 我 们 将 对 这 一 方法 作 详 细 的 阐述 )。 

撤销 多 级 事务 所 做 的 修改 更 加 复杂 ， 因 为 它 的 一 些 子 事务 可 能 已 经 提交 ， 与 其 并 发 执行 
的 事务 已 经 看 到 更 新 后 的 数据 。 设 想 在 Dec 子 事务 Di 提交 后 ，Move 事 务 Ti 检测 到 一 个 异常 中 
LR. 因为 D; 有 其 孩子 事务 , 所 以 Di 提交 后 4 的 新 值 对 与 D, 并 发 执行 的 事务 来 说 是 可 访问 的 。 
简单 地 物理 恢复 6 到 它 原 来 的 值 不 一 定 有 效 。 例 如 ， 有 另外 一 个 与 Ti 并 发 执行 的 Move 事 务 T,， 
它 从 同一 个 班级 中 移 走 一 名 学 生 ， 在 D, 提 交 后 ， 它 的 Dec 子 事务 D; 立 刻 被 调用 ， 然 后 T, 提 交 ， 
如 图 21-4 所 示 。 在 这 种 情形 下 ， 班 级 学 生 数 被 减 两 次 。 由 于 在 D; 执 行 前 4 的 值 没 有 增加 ， 所 以 
如 果 在 T 异 常 中 止 的 情况 下 简单 地 恢复 t 到 它 原来 的 值 ， 则 D, 的 修改 将 被 丢失 ， 从 而 使 数据 座 
处 于 不 一 致 的 状态 。 . 

用 于 解决 这 种 问题 的 技术 称 为 补偿 (compensation). 这 种 技术 不 是 从 物理 上 恢复 原来 的 
值 ， 而 是 使 用 补偿 子 事 务 (compensating subtransaction) 从 逻辑 上 进行 撤销 。Dec 可 以 从 逻辑 
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上 成 功 撤 销 TestInc 操 作 ， 因 此 它 是 一 个 补偿 子 事务 。 同 样 ，Inc 可 以 从 逻辑 上 撤销 Dec 操 作 。 
类 似 地 ， 在 一 个 航班 预定 系统 中 ，cancellation 可 以 逻辑 上 撤销 reservation 操 作 ， 这 样 在 预订 子 
事务 系统 中 ，cancellation 就 成 为 reservation 子 事务 的 一 个 补偿 子 事务 。 


T: TestInc(sec3) Dec(sec,) abort 
Ty: TestInc(sec3) Dec(sec,) commit 





图 21-4 在 Ti 异常 中 止 时 ，seci 的 数量 减少 两 次 ， 此 时 ， 物 理 恢 复 产 生 错误 的 结果 


作为 应 用 设计 的 一 部 分 ， 应 用 程序 设计 者 必须 为 每 一 个 子 事 务 提供 补偿 子 事务 ， 这 并 不 
是 一 件 容 易 的 事 。 如 果 CT 是 ST 的 补偿 子 事务 ， 那 么 它 取 决 于 由 ST 执行 后 的 状态 。 例 如 ， 
Dec 只 有 在 实际 增加 后 才能 补偿 Testinc (否则 ， 神 偿 是 没有 必要 的 )。 在 ST 提交 后 ， 必 须 在 
日 志 中 存储 足够 的 信息 使 补偿 成 为 可 能 。 对 一 些 应 用 来 说 ,一 个 补偿 子 事务 没有 必要 在 逻 
辑 上 撤销 所 有 子 事务 对 数据 库 的 更 新 来 实现 补偿 。 例 如 ， 在 航班 应 用 中 ，cancellation 不 会 
从 列表 中 将 旅客 的 名 字 也 删除 。 因 此 ， 如 果 不 要 求 原子 性 ， 由 应 用 决定 的 补偿 可 以 不 必 精 
确 地 定义 。 

一 般 地 ， 在 Li-! 级 的 子 事务 STi11,… ,STi-i4， 提交 后 ， 要 在 级 异常 中 止 子 事务 ST,,， 则 补 
偿 子 事务 按 相反 的 顺序 来 执行 : CTit CTii, 这 里 CTi_ i 补偿 ST 1,。 在 图 21-3 中 ， 如 果 
TestInc(secy) 在 调用 Upd(t,) 前 异常 中 止 ， 则 可 以 不 采取 任何 操作 (因为 Sel(1,) 不 需要 补偿 )。 但 
如 果 在 调用 Vpd(o) 之 后 中 止 ， 就 必须 执行 补偿 更 新 操作 ， 对 bb 作 减 法 。 如 果 Move 在 Dec(sec)) 
提交 后 中 止 ， 就 必须 按照 它 的 顺序 执行 TestInc(sec) 补 偿 。 在 23.6 节 ， 将 对 补偿 做 更 加 详细 的 
讨论 。 


21.3 把 应 用 分 解 成 多 个 事务 


在 很 多 情况 下 ， 把 一 个 普通 的 事务 分 解 成 更 小 的 事务 是 有 必要 的 。 例 如 将 一 个 长 事务 分 
解 ， 使 它 在 中 间 状 态 释 放 锁 ， 可 达到 改善 性 能 的 目标 ， 或 者 通过 在 一 些 中 间 点 提交 避免 在 发 
生 系 统 崩 涡 时 丢失 更 多 的 工作 。 在 有 些 情况 下 ， 一 个 事务 可 能 包括 在 不 同时 间 发 生 的 子 任务 。 
在 本 节 中 ， 我 们 探讨 提供 这 种 结构 的 方法 以 及 把 复杂 业务 看 作 子 任务 集 的 工作 流 管 理 系统 ， 
其 中 这 些 子 任务 是 以 依赖 于 应 用 的 某 种 方式 执行 的 。 


21.3.1 链 式 事务 


通常 情况 下 ， 一 个 应 用 程序 由 一 系列 事务 组 成 。 例 如 ， 一 个 分 类 订购 应 用 可 能 是 由 三 个 
事务 的 序列 组 成 的 应 用 程序 ， 这 三 个 事务 是 订购 商品 、 运 输 、 结 账 。 在 它们 执行 期 间 ， 程 序 
把 订购 的 商品 条 目 、 定 购 人 信息 存储 在 局 部 变量 中 ， 也 可 以 用 这 些 信息 进行 一 些 计算 。 

一 个 小 的 优化 〈 称 为 链 (chaining ) ) 可 以 在 序列 中 的 前 一 个 事务 提交 时 ， 自 动 开始 执行 
一 个 新 事务 ， 从 而 达到 除 第 一 个 事务 之 外 ， 不 必 对 其 他 事务 使 用 begin_transaction0( 也 减少 了 
调用 数据 库 管理 系统 的 开销 ) ”。 启 用 事务 链 后 ， 由 事务 序列 组 成 的 应 用 程序 有 如 下 的 形式 : 


O ”实际 上 ， 可 能 不 再 需要 begin_transaction() 了 ， 因 为 与 服务 器 的 第 一 次 交互 能 自动 地 开始 一 个 事务 。 
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begin_transaction(); 
commit () ; 
S2; 
commit(); 
Spat 
commit (); 
Sp; 
commit(); 
这 里 ，$ 是 第 企 事务 37 的 主体 部 分 。 
每 一 个 提交 语句 的 执行 使 前 一 个 事务 对 数据 库 所 做 的 修改 持久 地 反映 在 数据 库 中 。 因 此 ， 
如 果 在 事务 87 的 执行 过 程 中 发 生 贿 溃 ， 那 么 当 系 统 重启 时 ， 事 务 87) ，…，3ST-: 对 数据 库 所 做 
的 修改 就 保留 在 数据 库 中 。 当 然 ， 应 用 程序 存储 在 局 部 变量 中 的 信息 会 丢失 。 
在 设计 长 事务 (如 前 面 介绍 的 学 生 缴费 系统 ) 时 ， 可 以 从 另 一 个 角度 来 看 待 链 式 事务 。 
和 自动 开始 执行 一 个 新 事务 相反 ， 我 们 关心 的 是 在 系统 崩溃 时 避免 回 退 整个 事务 。 使 用 链 ， 
一 个 长 事务 就 可 以 分 解 成 代码 片段 序列 S$,，5;，…，5,， 这 些 序列 像 上 面 描述 的 那样 链接 在 一 
起 ， 其 中 每 一 个 片段 是 一 个 子 事务 。 例 如 ， 学 生 缴 费事 务 可 以 分 解 成 10 个 子 事务 ,每 一 个 子 
事务 负责 1000 名 学 生 的 缴费 。 
在 把 一 个 长 事务 分 解 成 链 时 需要 考虑 以 下 问题 : 
1) 如 果 在 执行 子 事 务 时 系统 发 生 崩 涡 ， 那 么 只 有 当前 的 子 事务 结果 丢失 ， 因 为 该 子 事务 
之 前 的 各 子 事务 结果 已 持久 化 〈 相 反 ， 使 用 存储 点 的 事务 在 系统 发 生 崩溃 时 整个 事务 的 结果 
都 丢失 )。 但 是 ， 事 务 作为 一 个 整体 不 再 保持 原子 性 。 在 恢复 后 ， 系 统 不 负责 从 发 生 贿 溃 的 事 
务 重启 链 。 
2) 由 于 各 子 事务 本 来 是 事务 的 一 部 分 ， 并 且 它 单独 完成 一 项 任务 ， 所 以 相互 之 间 通 常 需 、 
要 进行 通信 。 通 过 访问 共享 的 局 部 变量 集合 可 以 轻松 实现 通信 。 例 如 ， 如 果 学 生 缴 费事 务 按 
上 述 方式 进行 分 解 ， 则 一 个 局 部 变量 可 能 包含 最 后 一 个 已 缴费 学 生 的 索引 。 当 新 的 子 事务 开 
始 时 ， 就 用 这 个 变量 来 确定 下 一 个 该 缴费 的 学 生 。 使 用 局 部 变量 通信 的 问题 在 于 崩溃 发 生 时 
局 部 变量 不 能 保存 下 来 ， 在 执行 恢复 时 ， 确 定 下 一 个 应 缴费 的 学 生 是 很 困难 的 。 
作为 一 种 替代 ， 各 子 事务 可 以 借助 数据 库 变量 来 进行 通信 。 例 如 ， 最 后 一 个 已 缴费 的 学 
生 的 索引 在 子 事务 提交 前 保存 在 数据 库 的 项 中 。 如 果 在 下 一 个 子 事务 执行 期 间 发 生 崩溃 ， 就 
可 由 数据 库 中 数据 项 的 值 指明 恢复 的 地 点 。 在 这 种 情况 下 ， 数 据 库 中 用 于 通信 的 数据 项 的 值 ， 
对 其 他 应 用 程序 中 正在 执行 的 事务 (并 发 的 ) 来 说 是 可 用 的 ， 但 必须 注意 确保 它 不 被 其 他 应 
用 程序 所 自 改 。 . 
3) 数据 库 中 被 链 式 事务 访问 的 那 部 分 状态 称 为 数据 库 上 下 文 (database context)， 它 并 
不 是 维持 在 事务 链 中 一 个 子 事务 和 下 一 个 子 事务 之 间 。 例 如 ， 如 果 用 锁 来 实现 隔离， 那么 子 
事务 ST 的 所 有 锁 在 子 事务 提交 后 都 必须 释放 。 因 此 ， 如 果 ST; 是 链 中 的 下 一 个 子 事务 ， 它 访 
问 STi 访 问 过 的 数据 项 ， 那 么 在 ST 春来， 数据 项 的 值 可 能 不 同 于 ST 提交 时 的 值 (因为 有 不 
在 该 链 中 的 其 他 事务 ， 在 ST 提交 后 和 ST 访问 前 的 期 间 ， 对 值 进行 修改 并 提交 )。 问 题 在 于 ， 
和 一 个 长 事务 相反 ， 虽 然 链 式 事务 中 的 每 一 个 子 事务 是 隔离 的 ， 但 整个 链 式 事务 却 不 具有 隔 
` 离 性 。 
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另 一 方面 ， 数 据 库 上 下 文 是 任何 一 个 事务 打开 游标 后 的 一 种 状态 。 事 务 提交 则 关闭 游标 ， 
FST AT FF IU RIT ST, EE A FT AY o 

尽管 隔离 性 受到 损害 ， 但 构造 链 却 能 使 性 能 受益 。 长 事务 利用 锁 使 得 它 访 问 的 那 部 分 数 
据 库 长 时 间 不 可 访问 。 这 可 能 产生 性 能 瓶颈 ， 因 为 与 其 并 发 执行 的 事务 必须 等 到 该 事务 提交 
并 释放 锁 后 才能 访问 数据 库 。 通 过 将 事务 分 解 成 链接 的 子 事务 ， 锁 可 以 很 快 释放 ， 瓶 颈 也 就 
消除 。 

4) 关于 链 的 最 初 观点 在 于 ， 序 列 中 的 各 个 事务 是 相继 自动 执行 的 ， 前 一 个 事务 执行 完毕 ， 
下 一 个 事务 自动 开始 执行 。 这 样 ， 每 一 个 事务 都 保持 一 致 性 ， 并 且 在 事务 执行 期 间 数 据 库 也 
处 于 一 致 性 的 状态 。 当 我 们 把 链 看 作 分 解 一 个 长 事务 的 机 制 时 ， 情 况 就 发 生变 化 。 尽 管 整个 
长 事务 是 一 致 性 的 ， 但 各 个 子 事务 并 不 一 定 保 持 一 致 性 。 这 就 产生 一 个 问题 ， 因 为 每 一 个 子 
事务 在 提交 后 都 释放 数据 库 上 下 文 ， 使 得 它 对 与 其 并 发 执行 的 事务 来 说 是 可 见 的 。 这 些 事务 
希望 数据 库 处 于 一 致 性 的 状态 ， 因 此 必须 要 求 各 子 事务 也 是 一 致 性 的 。 使 用 存储 点 时 不 会 发 
生 一 致 性 问题 。 因 为 整个 事务 是 保持 隔离 性 和 原子 性 的 。 在 存储 点 ， 数 据 库 上 下 文 并 没有 被 
释放 ， 与 其 并 发 执行 的 事务 不 会 看 到 不 一 致 的 状态 。 

为 应 对 系统 崩 祯 ， 子 事务 也 必须 是 一 致 性 的 。 如 果 发 生 贿 溃 时 ， 链 式 事务 没有 执行 完 ， 
那么 系统 重启 时 ， 部 分 结果 对 其 他 应 用 的 事务 来 说 是 可 见 的。 因此 链 式 事务 既 不 具有 隔离 性 ， 
同时 它 也 不 具有 原子 性 。 

1. Saga 

[Garcia-Molina and Salem 1987] 提出 一 个 事务 模型 ， 称 作 saga， 其 中 的 链 式 事务 原子 性 是 
通过 补偿 来 实现 的 。 链 中 的 每 一 个 子 事务 都 有 一 个 补偿 事务 。 如 果 一 个 链 式 事务 T; 由 子 事务 
ST, <j< nn) 组成，CT;j 是 5Tij 的 补偿 事务 ， 那么 T 的 执行 会 有 以 下 两 种 形式 。 如 果 T 成 功 执行 ， 
则 子 事务 序列 如 下 : | 


STi» STi2, ey STin 
如 果 在 ST 执行 期 间 系统 发 生 崩 涡 ， 则 子 事务 就 会 异常 中 止 ， 执 行 序列 如 下 : 
STi, STj2, ar) ST;;5 CT;,, my CT; 


这 样 ， 就 从 一 方面 获得 了 原子 性 : 如 果 T 的 任意 子 事务 异常 中 止 ， 那 么 已 提交 子 事务 所 做 的 所 
有 变化 都 会 撤销 。 但 它 可 能 不 是 原子 性 的 ， 因 为 在 补偿 事务 执行 前 ， 可 能 有 并 发 子 事务 读 取 
已 提交 子 事务 所 做 的 修改 。 相 反 ， 在 多 级 事务 模型 中 ， 使 用 补偿 来 保证 子 事务 的 原子 性 和 可 
串 行 化 来 控制 子 事务 〈 将 在 23.7.5 节 进行 描述 )， 
2. 链 式 事务 的 另 一 种 语义 
从 教学 的 角度 来 看 ， 考 虑 链 式 事务 的 另 一 种 语义 是 有 意义 的 ， 它 能 处 理 传统 解释 所 引起 
的 问题 ， 为 将 新 的 语义 与 常规 语义 加 以 区 分 ， 我 们 使 用 函数 调用 chain()， 现 在 一 个 链 式 事务 
可 以 有 以 下 形式 : 
begin_transaction QO; 
$33 
chain(); 
S3; 
chain(); 
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5 1; 
chain(); 
Sp; 

commit(); 

Chain() 提 交 一 个 子 事务 ST ( 因而 是 持久 的 )， 开 始 一 个 新 的 子 事务 5T;,1,， 但 它 并 不 释放 
数据 库 上 下 文 ， 并 且 保 持 游标 。 例 如 ， 当 用 锁 实现 隔离 性 时 ，ST 保 持 的 锁 不 是 被 释放 而 是 传 
递 给 S57;,1， 因 此 ， 当 ST 访问 ST 访 问 过 的 数据 时 ， 它 所 看 到 的 数据 值 和 ST 提交 后 的 值 是 一 样 
的 。 因 为 ST; 对 数据 库 的 修改 对 与 其 并 发 执行 的 事务 来 说 是 不 可 见 的 ， 所 以 单个 子 事务 不 再 保 
持 一 致 性 ， 如 果 5T;, 按 这 种 方法 设计 ，5T 就 可 以 让 数据 库 处 于 一 种 不 一 致 的 状态 。 因 而 链 式 
事务 作为 一 个 整体 是 隔离 的 ， 虽 然 其 性 能 会 受到 损害 。 

从 这 一 语义 来 讲 ， 故 障 恢 复 是 非常 复杂 的 。 如 果 恢 复 只 是 回 退 在 系统 发 生 崩 溃 时 处 于 活 
动 状态 的 子 事务 ， 那 么 隔离 性 就 得 不 到 保证 ， 因 为 在 系统 恢复 后 启动 的 事务 会 看 到 一 种 不 一 
致 的 状态 。 链 式 事务 作为 一 个 整体 是 不 能 回 退 的 ， 因 为 链 中 前 面 的 子 事务 已 经 提交 。 这 意味 
着 ， 利 用 新 的 语义 ， 当 一 个 链 式 事务 的 任意 一 个 子 事务 提交 后 ， 它 必须 向 前 回 退 。 如 果 在 执 
行 STi, 期 间 系统 发 生 崩 溃 ， 那 么 恢复 过 程 重启 ST,,,， 并 传送 ST 提交 后 的 数据 库 上 下 文 给 ST 
( 即 数据 库 上 下 文 和 ST 锁定 时 是 一 样 的 )。 这 种 重启 为 作为 整体 的 链 式 事务 提供 隔离 性 和 原子 
性 。 和 链 式 事务 相反 ， 一 个 平坦 事务 在 发 生 崩溃 后 ， 系 统 不 负责 自动 重启 。 


21.3.2 用 可 恢复 队列 调度 事务 


在 链 式 事务 中 ， 事 务 以 序列 形式 组 织 和 处 理 ， 前 一 个 事务 执行 完 后 下 一 个 事务 开始 执行 。 
但 有 时 ， 一 个 应 用 要 求 事务 按 顺 序 执行 ， 但 不 是 作为 一 个 单元 来 依次 执行 ， 相 反 ， 它 要 求 一 
个 事务 执行 完 后 ， 下 一 个 事务 开始 执行 并 运行 到 结束 。 和 链 式 事务 不 同 ， 在 一 个 事务 执行 完 
成 与 下 一 个 事务 执行 前 的 间隔 里 系统 可 能 发 生 崩溃 。 

正如 我 们 在 前 面 所 看 到 的 ， 一 个 分 类 订购 活动 可 能 包含 三 个 任务 : 下 订单 、 运 输 和 结账 ， 
这 些 任务 可 能 由 三 个 独立 的 事务 来 完成 ， 运 输 和 结账 事务 的 工作 可 以 在 下 订单 事务 提交 后 的 
任何 一 个 时 间 来 完成 。 不 过 重要 的 是 ， 在 订购 后 即使 系统 发 生 崩 省， 这 些 事务 在 后 来 的 某 个 
时 间 也 能 够 执行 。 

作为 另外 一 个 例子 ， 我 们 可 以 考虑 一 个 分 布 式 应 用 ， 其 中 本 地 站 点 上 的 一 个 事务 T 要 在 远 
程 站 点 上 完成 某 些 操作 。 如 果 远 程 操 作 和 事务 T 整 合 在 一 起 ， 涉 及 动作 的 调用 和 接收 确认 消息 
的 网 络 延 迟 都 成 为 事务 T 的 响应 时 间 的 一 部 分 。 但 车 不 要 求 远程 操作 和 事务 T 一 起 作为 一 个 独 
立 的 单元 来 执行 ， 而 是 只 要 它 最 终 执行 就 行 ， 那 么 它 就 可 以 设计 成 一 个 由 T 来 调度 后 续 执行 的 
单独 事务 ，T 的 响应 时 间 也 不 会 因 网 络 延迟 而 受到 影响 。 ` 

这 样 一 些 应 用 需要 极为 可 靠 的 机 制 来 确保 将 来 事务 的 实际 执行 ， 这 样 的 一 个 机 制 就 是 可 
恢复 队列 (recoverable queue)。 可 恢复 队列 有 常规 队列 的 语义 。 它 的 API 人 允许 事务 执行 队列 项 
的 入 队 和 出 队 操 作 。 事 务 可 以 让 描述 某 些 工作 的 信息 项 入 队 ， 在 一 个 后 续 的 时 间 里 ， 如 果 事 
务 提交 ， 这 些 工作 必须 执行 。 信 息 项 中 的 信息 和 本 地 状态 信息 一 样 必须 传递 给 链 中 的 后 续 事 
务 。 在 后 来 的 某 个 时 间 ， 信 息 项 由 另 一 个 事务 执行 出 队 。 第 二 个 事务 可 能 是 由 服务 器 启动 的 
过 程 ， 它 不 断 地 将 信息 项 从 队 中 取出 并 进行 处 理 。 

作为 一 个 例子 ， 考 虑 用 户 想 对 网 上 第 二 天 即将 拍卖 的 某 件 物品 投标 的 情形 。 用 户 运行 一 
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个 事务 ， 将 他 所 投 的 标 放 在 一 个 可 恢复 的 队列 中 ， 后 来 ， 在 拍卖 发 生 之 前 ， 另 一 个 事务 将 他 
所 投 的 标 从 队列 中 去 除 并 放置 在 拍卖 的 数据 库 中 (注意 ， 拍 卖 数据 库 中 的 项 可 以 依 拍卖 规则 
按 投标 顺序 保存 )。 这 样 安排 的 好 处 在 于 ， 只 要 该 用 户 投 的 标 进入 队列 ， 系 统 就 可 以 对 用 户 的 
投标 快速 反应 。 而 另 一 种 安排 方式 将 买主 投 的 标 直接 放 在 拍卖 数据 库 中 ， 但 由 于 数据 库 的 操 
作 开 销 很 大 ， 所 以 会 有 一 个 较 长 的 响应 时 间 。 

为 让 一 个 由 已 提交 事务 执行 人 队 的 项 最 终 得 以 执行 ， 队 列 必 须 是 持久 的 。 持 久 性 意味 着 
队列 必须 在 出 现 各 种 故障 时 都 能 幸存 下 来 。 所 以 ， 和 数据 库 一 样 ， 队 列 必 须 在 大 容量 数据 库 
上 元 余 存 储 。 事 务 的 原子 性 要 求人 队 和 出 队 操 作 必 须 以 下 列 形式 与 事务 的 提交 保持 协调 : 

。 如果 事务 插入 一 项 到 队列 中 ， 在 事务 异常 中 止 后 ， 该 项 必须 从 队列 中 删除 。 

* 如果 事务 从 队列 中 删除 一 项 ， 在 事务 异常 中 止 后 ， 该 项 必须 重 置 在 该 队列 中 。 

“一 个 事务 T 插 和 的 项 在 它 提交 之 前 不 能 被 另 一 个 事务 从 队列 中 删除 (因为 我 们 不 知道 事 

务 T 会 不 会 提交 )。 

注意 ， 直 接 在 数据 库 中 实现 具备 上 述 性 质 的 队列 是 可 能 的 ， 将 数据 项 插入 队列 的 事务 只 
是 更 新 用 于 实现 队列 的 表 。 问 题 在 于 这 些 表 被 过 多 的 事务 访问 。 在 第 23 章 和 第 24 章 我 们 将 看 
到 ， 大 多 数 的 隔离 是 使 用 锁 协 议 来 实现 的 ， 这 里 事务 对 共享 数据 经 常 延迟 更 新 。 从 性 能 的 角 
度 来 看 ， 把 队列 作为 一 个 独立 的 模块 来 处 理 是 可 取 的 ， 这 种 独立 的 模块 是 从 隔离 角度 看 的 一 
种 特殊 情况 。 

队列 的 恢复 可 以 使 用 多 种 调度 策略 ， 包 括 先进 先 出 (FIFO) 和 按 优先 权 排 序 。 系 统 还 可 
以 使 用 一 个 过 程 检查 队列 ， 将 某 个 项 从 队列 中 删除 。 注 意 ， 这 里 即使 队列 是 FIFO 的 ， 也 并 不 
一 定 按 FIFO 的 顺序 处 理 其 中 的 项 。 例 如 ， 事 务 Ti 可 能 从 一 个 FIFO 队 列 中 删除 队列 的 头 部 BE， 
在 后 来 的 某 个 时 间 里 ， 事 务 T, 使 新 的 队列 的 头 部 Es 出 队 。 如 果 后 来 了 异常 中 止 ， El 仍然 是 队列 
的 头 部 。 结 果 是 第 二 项 E 先 于 BE, 得 到 服务 ， 这 和 FIFO 队 列 的 要 求 是 相 矛盾 的 。 

组 织 分 类 订购 应 用 的 一 种 方式 就 好 像 管道 一 样 ， 如 图 21-5 所 示 。 订 单 输入 职员 执行 一 个 
事务 ， 它 按 订购 的 顺序 将 订单 项 插入 到 一 个 可 恢复 队列 中 供 运 输 事 务 使 用 ， 然 后 提交 。 后 来 ， 
运输 服务 器 执行 一 个 事务 让 该 项 出 队 ， 按 要 求 完成 指定 的 操作 ， 将 要 结账 的 订单 插入 到 第 二 
个 可 恢复 队列 中 供 结账 时 使 用 ， 然 后 提交 。 接 着 ， 结 账 服务 器 执行 一 个 出 队 事务 ， 完 成 指定 
的 操作 后 提交 。 这 样 组 织 方式 就 像 一 个 管道 ， 因 为 每 一 项 对 应 一 个 购买 过 程 ， 按 顺序 从 一 个 
队列 到 下 一 个 队列 。 


| P "| 


图 21-5 以 管道 方式 组 织 使 用 可 恢复 队列 的 系统 


男 一 种 组 织 方法 如 图 21-6 所 示 。 订 购 事务 同时 将 订单 项 插入 到 两 个 可 恢复 队列 中 ， 一 个 
是 结账 队列 ， 一 个 是 运输 队列 ,然后 提交 。 后 来 ， 处 理 结账 的 事务 将 订单 项 从 结账 队列 中 删 
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除 ， 完 成 适当 的 操作 后 提交 ; 运输 事务 将 订单 项 从 运输 队列 中 删除 ， 完 成 适当 的 操作 后 提交 。 
这 样 组 织 使 得 同一 订单 的 结账 事务 和 运输 事务 并 发 执行 ( 当然 ， 顾 客 在 收 货 之 前 先 收 到 账单 
可 能 会 不 高 兴 )。 


| 运输 队列 






结账 队列 
图 21-6 使 用 可 恢复 队列 来 获得 并 发 的 系统 


在 分 布 式 系统 的 例子 中 ， 中 心地 点 A 的 一 个 事务 可 能 插入 一 项 到 本 地 可 恢复 队列 中 ， 该 队 
列 所 描述 的 动作 必须 在 远程 地 点 B 执 行 。 后 来 ， 一 个 分 布 式 事务 在 B 启 动 ， 同 时 可 能 在 A 产 生 
一 个 子 事务 ， 它 从 队列 中 删除 那 一 项 ， 然 后 发 送 到 B 来 执行 。 

1. 用 于 调度 现实 事件 的 可 恢复 队列 

当 一 个 事务 要 求 完成 一 些 实际 操作 (如 打印 取款 收据 ) 时 ， 可 恢复 队列 可 用 于 获得 原子 
性 特征 。 和 数据 库 的 更 新 不 同 ， 现 实 世界 的 动作 是 不 能 回 退 的 。 一 旦 事务 执行 ， 就 不 能 因 事 
务 的 异常 中 止 ( 如 系统 崩 祺 或 死 锁 引起 的 异常 中 止 ) 而 回 退 。 这 意味 着 事务 异常 中 止 是 不 能 
维持 原子 性 的 〈 如 一 个 事务 从 ATM 系 统 上 取现 金 ， 在 事务 提交 前 系统 崩溃 会 怎样 呢 ? 即 使 在 
现金 已 被 取出 的 情况 下 ， 数 据 库 中 相应 于 取款 的 修改 也 会 被 回 退 )。 

使 用 可 恢复 队列 就 能 获得 期 望 的 语义 一 一 当 且 仅 当 事务 提交 时 ， 现 实 动作 才 会 发 生 。 事 
务 在 提交 前 将 一 个 完成 现实 世界 动作 的 请 求 插入 到 一 个 可 恢复 队列 中 。 如 果 事 务 异常 中 目 ， 
请 求 就 被 删除 ， 如 果 事 务 提交 ， 请 求 就 被 保存 下 来 ， 由 后 来 完成 所 需 操作 的 实际 事务 满足 访 
请 求 。 

但 这 种 解决 方法 仅 适 于 现实 事务 。 如 果 事 务 正在 执行 的 时 候 系统 崩溃 又 会 怎样 呢 ? 我 们 
知道 请 求 将 保存 在 可 恢复 队列 中 ， 但 我 们 怎么 能 知道 在 系统 崩溃 之 前 ， 事 务 是 否 完成 操作 
Ye? 我 们 必须 知道 ， 在 系统 重启 时 ， 现 实事 务 是 否 应 该 重新 执行 。 i 

解决 这 个 问题 的 办 法 就 是 从 完成 实际 动作 的 物理 设备 那里 获得 帮助 。 假 设 设备 保留 着 一 
个 计数 器 ， 每 次 完成 一 个 操作 时 计数 器 就 会 增加 1， 且 计数 器 的 数值 可 被 现实 事务 读 取 。 在 操 
作 完成 后 ， 现 实事 务 Trw 读 取 这 一 数值 ， 在 提交 前 将 更 新 后 的 值 存储 在 数据 库 中 ， 在 恢复 时 ， 
系统 就 会 读 取 这 一 数值 ， 并 将 该 值 与 存储 在 数据 库 中 的 值 比较 。 如 果 值 相等 ， 就 不 需 做 其 他 
操作 ， 因 为 上 一 次 现实 事务 已 经 提交 。 如 果 值 不 相等 ， 物 理 设备 上 的 值 一 定 比 存储 在 数据 库 
中 的 值 大 1， 这 表明 实际 动作 已 经 执行 ， 但 由 于 系统 崩溃 ， 相 应 的 现实 事务 Tw 异常 中 止 。 因 
此 ， 在 队列 头 部 恢复 Tew 删除 的 项 ，Trw 可 能 已 将 更 新 后 的 值 存储 在 数据 库 中 ， 也 可 能 没有 
外 使 已 经 存储 ， 也 必须 回 退 。 因 此 系统 能 够 推断 出 队 首 项 所 要 求 的 实际 操作 已 经 完成 ， 但 相 
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应 的 现实 事务 却 没 有 提交 。 

2. 用 于 支持 前 向 代理 的 可 恢复 队列 

另 一 个 与 可 恢复 队列 粗 关 的 机 制 是 前 向 代理 (forwarding agent)， 考 虑 一 个 客户 机 想 调用 
一 个 服务 ， 却 发 现 目标 服务 器 不 可 用 的 情形 。 如 果 所 要 求 的 服务 可 推迟 ， 那 么 客户 机 可 以 将 
它 的 服务 请 求 插入 到 队列 中 ， 等 到 目标 服务 器 可 用 时 得 到 服务 。 前 向 代理 是 在 后 来 的 某 个 时 
间 激 活 目标 服务 器 的 机 制 。 它 定期 地 启动 一 个 事务 从 请 求 服务 队列 中 删除 一 项 ， 激 活 目 标 服 
务 器 ， 然 后 等 待 响应 。 如 果 事 务 没 有 成 功 执行 (如 目标 服务 器 仍然 不 可 用 ) ， 它 就 异常 中 止 ， 
并 将 删除 项 恢复 到 原来 的 队列 中 供 以 后 服务 。 如 果 事 务 成 功 提交 ， 一 个 响应 项 就 插入 到 回复 
队列 中 供 以 后 客户 机 使 用 (如 图 21-7 所 示 )。 注 意 ， 目 标 服 务 器 是 不 能 区 分 激活 它 的 这 两 种 情 
况 的 。 它 的 操作 是 独立 的 ， 不 论 它 是 直接 由 客户 机 激活 的 还 是 由 代理 间接 地 激活 的 。 





图 21-7 使 用 前 向 代理 激活 服务 器 


3. 可 恢复 队列 作为 一 种 通信 机 制 

可 恢复 队列 可 以 看 作 一 种 可 靠 的 通信 机 制 ， 通 过 它 ， 各 模块 之 间 可 以 相互 通信 。 和 前 面 
讨论 的 联机 的 、 直 接 的 通信 方法 不 同 ， 而 使 用 队列 的 通信 是 延迟 的 。 这 类 似 于 把 消息 留 在 电 
话 答 录 机 中 。 因 为 队列 是 可 恢复 的 ， 即 使 系统 发 生 崩 溃 ， 延 迟 通信 还 是 能 实现 。 


21.3.3 扩展 事务 


传统 的 事务 概念 及 其 相关 的 ACID 性 质 在 很 多 应 用 中 是 非常 有 用 的 ， 特 别 是 执行 时 间 非 党 
短 〈 几 秒 钟 或 可 能 是 几 分 钟 )、 事 务 访问 数据 项 相对 较 少 、 数 据 库 是 本 地 的 情形 。 学 生 注册 系 
统 就 是 一 个 典型 的 例子 。 

但 大 部 分 的 应 用 并 不 满足 这 些 规则 。 例 如 在 CAD/CAM、 办 公 自 动 化 、 软 件 开发 环境 中 ， 
事务 可 能 持续 几 个 小 时 或 几 天 ， 可 能 访问 不 同 服务 器 上 的 多 个 数据 。 为 这 样 的 长 事务 保持 隔 
离 性 和 原子 性 会 严重 损害 系统 的 性 能 。 隔 离 性 意味 着 事务 T 对 数据 库 所 作 的 修改 在 它 提交 之 前 
对 与 其 并 发 执行 的 事务 来 说 是 不 可 见 的 。 并 发 事务 必须 等 待 ， 当 事务 T 是 一 个 长 事务 并 访问 多 
个 数据 时 ， 系 统 的 性 能 就 会 受 损 。 原 子 性 要 求 一 个 事务 的 所 有 子 事务 要 么 全 部 提交 ， 要 么 全 
部 异常 中 止 。 保 证 原子 性 要 求 服务 器 工作 在 原子 性 提交 协议 下 (我 们 将 在 第 26 章 讨论 )。 但 不 是 
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所 有 的 服务 器 都 愿意 或 能 够 参与 这 一 协议 的 。 

由 于 上 述 原因 ， 事 务 模型 被 推广 为 一 种 扩展 的 (extended) (或 高 级 (advanced ) ) 事务 模 
Æ (transaction model)。 这 里 有 几 种 保持 原 义 的 事务 模型 ， 这 无 疑 是 有 趣 的 ， 它 们 为 商务 系 
统 中 的 实际 工作 流 模 型 提供 支持 。 

扩展 事务 模型 的 共性 是 它们 不 再 保持 ACID 性 质 ， 这 些 模 型 允许 应 用 程序 员 设 计 在 不 同 程 
度 上 满足 原子 性 和 隔离 性 的 事务 。 因 此 ， 必 须 小 心 设计 扩展 事务 以 免 出 错 。 

利用 和 分 布 式 事务 相似 的 方式 ， 扩 展 事务 被 设计 成 运行 在 由 多 个 数据 库 服务 器 组 成 的 多 
数据 库 系统 上 的 事务 。 扩 展 事务 是 由 多 个 子 事务 组 成 的 ， 为 简单 起 见 ， 假 设 每 个 服务 器 输出 
一 个 事务 集 ， 所 有 事务 集 组 成 一 个 子 事务 库 ， 从 而 形成 一 个 扩展 的 事务 。 

扩展 事务 模型 将 执行 状态 (execution state) 与 每 个 子 事务 相关 联 。 可 能 的 执行 状态 包括 : 
异常 中 止 、 提 交 、 正 在 执行 、 没 有 执行 、 补 偿 、 准 备 提交 (准备 提交 状态 将 在 26.2 节 讨论 ) 
子 事务 可 以 处 在 提交 状态 意味 着 扩展 事务 模型 没有 必要 保证 隔离 性 。 因 此 ， 一 个 扩展 事务 (未 
提交 ) 的 已 提交 子 事务 所 产生 的 数据 库 状 态 对 另 一 个 扩展 事务 的 子 事务 来 说 是 可 见 的 。 

另外 ， 一 些 扩展 的 事务 模型 允许 一 个 已 提交 的 子 事务 报告 其 逻辑 状态 ， 如 成 功 执行 或 没 
有 成 功 执 行 。 银 行 的 一 个 不 成 功 的 取款 操作 可 能 是 由 于 没有 足够 的 资金 引起 的 。 注 意 ， 在 这 
两 种 情况 下 子 事务 都 已 经 提交 。 

利用 分 布 式 事务 ， 应 用 设计 者 必须 定义 扩展 事务 的 子 事务 的 执行 顺序 。 不 是 按 先 后 顺序 
岁入 到 事务 程序 里 (例如 ， 对 客户 机 到 服务 器 的 远程 过 程 调用 的 处 理 )， 扩 展 事务 模型 使 用 外 
部 规格 说 明 。 可 以 利用 图 的 形式 来 说 明 ， 这 里 子 事务 是 节点 ， 边 表明 子 事务 的 先后 顺序 。 也 
可 以 用 一 个 规则 的 集合 或 控制 流 语 言 来 表示 。 不 管 怎样 ， 子 事务 可 以 通过 其 他 子 事务 的 功能 
输出 ， 也 可 能 是 它们 的 执行 状态 。 

程序 员 可 以 用 以 下 方式 来 规定 子 事务 的 启动 : 


initiate ST;; when ST;, committed (21.1) 


这 里 ，5Tij 和 57T;x 是 扩展 事务 ET; 子 事务 。ST;j 只 有 在 ST;s 提 交 后 才能 开始 执行 。 如 果 ST4 异 
常 中 止 ，5Ti 就 根本 不 会 启动 。 下 列 规格 说 明 


initiate ST;,, ST,, when ST;, committed . 


使 一 个 扩展 事务 内 的 子 事务 STi- ST;x 并 发 执行 。 另 外 一 种 设计 方法 如 下 所 示 : 


initiate ST;, when STik aborted 


这 里 5ST;s 是 一 个 子 事务 ， 它 用 另 一 种 方法 来 完成 ST;; 所 承担 的 任务 。 使 用 这 种 技术 ， 就 可 以 指 
定 多 条 成 功 执行 扩展 事务 的 路 径 。 

例如 ，STix 可 能 是 一 个 旅行 计划 扩展 事务 的 子 事务 ， 它 预定 一 张 从 纽约 到 华盛顿 的 机 票 ， 
Fn a MUERTE SOLES, PIRRE TEF RATT. AST. 
并 要 求 只 有 在 STix 异 常 中 止 时 ST;s 才 能 提交 。 

子 事务 是 可 以 重复 尝试 (retriable) 的 ， 这 表明 即使 在 开始 时 异常 中 止 ， 但 只 要 它 重 试 足 
够 多 的 次 数 ， 它 最 终 是 能 提交 的 。 所 以 当 一 个 可 重复 尝试 的 事务 异常 中 止 时 ， 没 有 必要 给 它 
指定 其 他 路 径 。 只 要 规定 子 事务 可 重复 尝试 一 直到 提交 为 止 即 可 。 例 如 ， 一 个 存款 事务 是 可 
重复 尝试 的 ， 而 取款 事务 却 是 不 可 重复 尝试 的 (不 一 定 总 有 足够 的 资金 )。 如 果 一 个 扩展 事务 
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的 所 有 子 事务 都 是 可 重复 尝试 的 ， 那 么 这 个 扩展 事务 总 能 成 功 执行 。 

因为 扩展 事务 模型 不 一 定 保证 提交 的 原子 性 ， 所 以 当 一 个 扩展 事务 异常 中 止 时 就 引起 一 
个 问题 。 例 如 ， 一 个 用 户 可 能 决定 在 一 个 扩展 事务 执行 期 间 取消 它 ， 或 者 一 个 没有 其 他 可 选 
路 径 的 子 事务 ( 非 可 重复 尝试 的 ) 可 能 中 途中 止 。 那 么 正在 执行 的 扩展 事务 的 子 事务 可 能 中 
止 执行 ， 其 他 已 经 提交 的 子 事务 又 会 怎样 呢 ?” 它 们 的 影响 必须 撤销 。 例 如 ， 如 果 扩 展 事务 ET 
已 经 预定 旅馆 和 交通 工具 ， 在 旅行 被 取消 之 前 ， 预 定 航班 的 子 事务 ST;j 可 能 已 提交 。 在 多 级 事 
务 模型 和 saga 中 也 遇 到 过 这 样 的 问题 。 我 们 看 到 ， 在 这 些 模型 中 ， 应 使 用 补偿 而 不 是 物理 恢 
复 。 在 扩展 事务 模型 中 也 应 用 补偿 。 区 别 在 于 ， 多 级 事务 模型 的 补偿 确保 原子 性 和 可 串 行 化 。 
而 在 扩展 事务 模型 中 (或 在 saga 模 型 中 ) 却 不 保证 原子 性 和 可 串 行 化 。 

补偿 子 事务 是 扩展 事务 模型 的 一 部 分 。 只 包含 补偿 子 事务 的 扩展 事务 总 是 能 撤销 的 。 但 
有 些 子 事务 既 不 能 补偿 又 不 能 重复 尝试 。 例 如 ， 一 个 不 能 退票 的 预定 子 事务 是 无 法 恢复 和 重 
做 的 (这 里 不 能 确保 票 永远 可 用 )， 这 样 的 子 事务 通常 被 称 为 pivot。 

在 非 补 偿 的 子 事务 提交 后 撤销 扩展 事务 是 不 可 能 的 。 相 反 ， 在 这 点 一 定 有 可 能 执行 完 。 
所 有 后 续 执行 的 子 事 务必 须 是 可 重复 尝试 的 (或 必须 提供 其 他 适当 的 路 径 )。 因 此 ， 一 个 扩展 
事务 的 执行 是 由 可 补偿 子 事 务 的 执行 加 之 可 重复 尝试 的 子 事务 执行 的 。 单 个 pivot 子 事务 在 这 
两 种 情况 下 都 能 执行 。 

扩展 事务 模型 假设 存在 运行 控制 器 (run-time controller) ， 它 解释 先后 顺序 规则 及 子 事务 
的 性 质 〈 如 可 重复 尝试 或 是 可 补偿 ) ， 使 每 个 扩展 事务 执行 时 能 满足 上 述 要求 。 


21.3.4 工作 流 和 工作 流 管 理 系 统 


工作 流 (workflow) 是 企业 里 复杂 处 理 的 模型 ， 它 是 一 个 必须 按 特定 的 顺序 执行 的 任务 
E. 工作 流 中 的 任务 不 一 定 是 子 事务 。 例 如 ,分 类 订购 系统 可 能 包括 一 个 由 人 执行 的 任务 
(不 是 由 计算 机 来 执行 )， 它 的 目的 就 是 在 运输 之 前 包装 商品 。 其 他 任务 可 以 是 从 库存 数据 库 
中 删除 这 一 商品 的 数据 库 事 务 。 

工作 流 可 以 视 为 扩展 事务 的 泛 化 。 在 第 22 章 ， 我 们 将 看 到 工作 流 角色 在 应 用 服务 器 中 起 
的 作用 。 本 节 所 描述 的 工作 流 和 其 他 模型 有 很 多 共性 ， 但 它们 的 侧重 点 明显 不 同 。 

和 我 们 所 讨论 的 各 种 模型 相 比 ， 工 作 流 很 少 考虑 数据 库 和 ACID 性 。 它 所 考虑 的 是 复杂 的 
自动 执行 ， 长 时 间 运 行 的 商务 处 理 ， 包 括 在 分 布 式 或 异 构 环境 下 的 计算 和 非 计算 任务 。 工 作 
流 主要 关心 的 不 是 并 发 执行 和 原子 性 的 维持 。 工 作 流 中 的 任务 可 以 是 数据 库 事务 ， 它 局 部 满 
足 ACID 性 质 ， 但 工作 流 不 区 分 这 样 的 任务 和 非 事务 型 任务 。 

工作 流 里 面 的 每 一 个 任务 由 一 个 代理 (agent) 来 完成 ， 代 理 可 能 是 一 个 程序 、 一 个 硬件 
设备 或 是 一 个 人 。 销 售 跟踪 中 的 代理 可 以 是 一 个 软件 系统 ， 而 商品 包装 的 代理 则 可 能 是 一 个 
人 。 一 个 工作 流 是 在 一 段 比较 长 的 时 间 里 由 多 个 代理 来 完成 的 。 并 且 ， 通 常 工 作 流 是 在 分 布 
式 且 异 构 程度 很 高 的 环境 下 工作 的 ， 这 种 环境 中 可 能 还 涉及 遗留 系统 。 在 分 类 订购 的 实例 中 ， 
运输 和 结账 部 门 可 能 是 完全 分 开 的 ， 并 且 使 用 不 同 的 数据 库 系统 。 

每 一 个 任务 都 有 一 个 物理 状态 ， 如 正在 执行 、 提 交 、 或 异常 中 止 。 另 外 ， 任 务 的 完成 可 
能 产生 逻辑 状态 信息 ， 它 指示 事务 执行 成 功 还 是 失败 。 例 如 ， 在 分 类 订购 系统 中 ，T4s 可 能 发 
现 一 个 错误 的 顾客 贷款 利率 。 由 于 与 应 用 程序 相关 的 条 件 ， 它 产生 一 个 逻辑 失败 状态 。 
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在 扩展 事务 模型 中 ， 工 作 流 的 任务 必须 是 协同 工作 的 。 例 如 ， 某 个 任务 可 能 只 有 在 两 个 
或 多 个 任务 执行 完成 后 (一 个 与 条 件 ) 才能 调度 ， 或 多 个 任务 并 发 执行 。 

同样 ， 在 工作 流 执行 的 某 个 时 间 点 ， 可 能 有 完成 同一 个 目标 的 几 个 任务 , 但 只 有 其 中 的 
一 个 任务 应 该 执行 (一 个 或 条 件 )。 执 行 哪个 任务 依赖 于 其 逻辑 状态 ， 或 工作 流 中 前 面 任务 的 
输出 ， 或 依赖 于 某 些 外 部 变量 的 值 (如 时 间 )。 

图 21-8 所 示 是 一 个 描述 分 类 订购 系统 的 工作 流 。T! 取 出 订单 ， 任 务 T; 从 库存 数据 库 中 删除 
订购 的 商品 ， 同 时 启动 任务 Ts 和 Ts 并 发 执行 。Ts 把 订购 项 从 仓库 中 删除 ，T4 执 行 结账 功能 。 删 
除 订购 商品 后 ，Ts 进 行 包装 。 在 结 清 账 务 和 包装 好 后 ，T6 安 排 运输 ， 可 能 空运 (任务 T1)， 也 
可 能 陆运 (任务 T), 但 只 能 选择 其 中 的 一 种 方式 。 最 后 ， 当 客户 在 送 货 单 上 签字 接收 后 ， 数 
据 库 更 新 ， 表 示 订 购 已 经 完成 (任务 T,)。 





图 21-8 表示 分 类 订购 系统 中 任务 之 间 的 优先 执行 关系 的 工作 流 


除 逻 辑 失败 以 外 ， 一 个 任务 的 失败 可 能 是 一 些 系 统 相关 的 条 件 造成 的 ， 例 如 服务 器 关闭 。 
在 一 些 应 用 中 ， 这 样 的 任务 是 可 重 试 的 ， 这 种 情况 下 ， 该 任务 在 以 后 又 可 以 重新 运行 。 顾 客 
可 以 在 任意 时 刻 决定 取消 购买 ， 这 种 情形 下 就 说 工作 流失 败 。 异 常 中 止 用 在 这 里 不 合适 ， 因 
为 一 些 任 务 已 经 完成 ， 且 它们 的 结果 是 可 见 的 。 

处 理 这 种 失败 的 一 种 方法 是 使 用 补偿 ， 为 工作 流 中 的 每 一 个 任务 定义 一 个 补偿 任务 。 发 
生 运 行 失败 时 ， 对 每 一 个 已 完成 的 任务 按 相 反 的 顺序 执行 补偿 任务 。 例 如 ，T, 的 补偿 任务 将 
订购 项 恢复 到 库存 记录 中 。 如 果 在 执行 T; 和 Ts 时 发 生 失 败 ， 这 些 任务 就 回 退 ， 先 补偿 任务 T， 
然后 补偿 任务 T,。 

处 理 这 种 失败 还 可 以 采取 其 他 策略 。 如 果 一 个 工作 流 的 任务 序列 为 先 执行 Th 后 执行 Ts， 
如 果 在 运行 时 Ts 返回 一 个 逻辑 失败 状态 ， 工 作 流 设计 师 就 可 以 指定 恢复 TA 的 任务 ， 然 后 恢复 
任务 序列 中 和 TA、Ta 一 样 完成 同一 目标 的 其 他 任务 ， 但 这 也 许 不 是 一 种 理想 方式 。 

一 个 任务 产生 的 结果 通常 是 另 一 个 任务 的 输入 ， 但 这 不 一 定 和 控制 流 相 同 。 例 如 ， 在 图 
218 中 ， 在 Ti 执行 的 过 程 中 ， 顾 客 的 姓名 和 地 址 一 起 发 送 给 Ti 和 Ts， 而 订购 商品 的 ID 发 送 给 T。 
和 T，，T, 又 把 订购 商品 的 费用 发 送 给 Ts。 分 类 订购 系统 中 的 数据 流 和 商品 流 如 图 21-9 所 示 。 这 
里 就 有 一 个 格式 问题 ， 一 个 任务 输出 的 数据 在 输入 到 另 一 个 任务 之 前 可 能 要 转换 为 另 一 种 格 
式 。 当 信息 在 遗留 系统 之 间 传输 时 ， 这 样 的 问题 经 常 出 现 。 

一 般 来 说 ， 工 作 流 遵 从 这 样 的 事实 ， 即 并 不 是 所 有 的 任务 都 是 计算 型 的 ， 并 不 是 所 有 的 
代理 都 是 软件 系统 。 但 即使 所 有 的 任务 都 是 计算 型 的 ， 工 作 流 模型 和 扩展 事务 模型 一 样 ， 也 
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不 遵循 ACID 性 质 。 考 虑 隔离 性 。 在 工作 流 执行 时 ， 某 个 任务 可 能 释放 它 访问 过 的 资源 ， 使 工 
作 流 中 的 其 他 事务 可 以 利用 这 些 资 源 。 这 意味 着 一 个 工作 流 的 中 间 状 态 对 与 其 并 发 执行 的 工 
作 流 来 说 是 可 见 的 。 例 如 ， 任 务 T; 和 Ts 更 新 不 同 的 数据 库 。 考 虑 分 类 订购 工作 流 的 两 个 实例 
WJ 和 Ws,， 它 们 并 发 处 理 两 次 不 同 的 销售 。 在 Wi 中 ， 如 果 Ts 和 Ts 执行 期 间 ， 已 经 执行 完成 的 
Ws;， 那 么 W; 可 以 看 到 这 两 个 数据 库 的 中 间 状 态 ， 这 在 串 行 执行 的 工作 流 中 是 不 可 能 出 现 的 。 
在 这 类 应 用 中 违反 隔离 性 是 可 以 接受 的 。 


si 





图 21-9 图 21-8 中 分 类 订购 系统 中 的 数据 流 


作为 另外 一 个 例子 ， 考 虑 商务 环境 中 的 合作 : 作为 代理 的 人 在 完成 不 同 的 任务 时 互相 交 
流 信息 。 这 样 的 任务 不 是 隔离 的 ， 因 为 其 中 一 个 任务 产生 的 信息 可 能 影响 其 他 任务 的 执行 。 
但 这 种 通信 方式 对 某 些 应 用 来 说 是 可 取 的 。 i | 

另 一 个 非 隔 离 的 例子 就 是 对 文件 更 新 任务 。 如 果 文 件 没 有 加 锁 ， 工 作 流 中 一 个 任务 产生 
的 中 间 文 件 状态 对 其 他 任务 来 说 是 可 用 的 。 而 且 ， 文件 系统 一 般 不 提供 原子 性 ， 即 如 果 因 某 
种 原因 任务 异常 中 止 ， 文 件 将 停留 在 这 个 中 间 状 态 。 s 

最 后 ， 也 可 以 适当 地 削弱 原子 性 ， 因 为 原子 性 对 一 些 任 务 来 说 是 不 必要 的 。 我 们 的 分 类 
订购 工作 流 可 能 包括 一 个 任务 ， 它 把 顾客 的 姓名 加 到 邮件 列表 中 。 这 一 任务 失败 (如 邮件 列 
Be BTR JE WAU) 不 应 该 使 整个 工作 流 异常 中 止 ， 也 就 是 说 ， 即 使 后 来 广告 手册 无 法 送出 ， 但 
销售 必须 完成 。 

工作 流 管理 系统 

工作 流 管理 系统 (WfMS ) 为 工作 流 的 定义 (在 设计 时 ) 和 调度 、 监 控 执 行 提供 支持 。 工 
作 流 的 规格 说 明 通 常 不 涉及 任务 细节 ,但 关心 任务 的 顺序 和 它们 之 间 数 据 的 流动 。 工 作 流 规 
格 说 明 涉及 图 形 用 户 接口 (GUI)， 通 过 它 设计 者 可 以 画 出 类 似 21-8 和 21-9 的 图 ， 该 规格 说 明 
也 可 以 支持 一 种 语言 来 表达 任务 协调 规则 ， 如 式 (21-1) 所 示 。 对 一 个 事务 处 理 系 统 的 工作 
流 控制 器 ( 见 22.2.1) 来 说 ， 该 规格 说 明 能 让 设计 者 使 用 队列 或 类 似 方法 ， 来 指明 事务 是 顺序 
执行 还 是 并 行 执行 。 

工作 流 控制 涉及 根据 其 规格 说 明 的 解释 自动 执行 工作 流 。 这 里 所 说 的 解释 可 能 涉及 以 下 
问题 : 

“ 角色、 代理、 工作 列表 ”每 一 个 代理 有 一 个 属性 指定 一 个 角色 集 。 一 个 角色 (role) Hi 

述 代 理 所 能 完成 的 任务 ， 而 每 一 个 任务 都 有 其 相关 的 角色 。 工 作 流 控制 器 用 角色 来 确定 

能 完成 将 要 执行 的 任务 的 代理 。 例 如 ， 在 图 21-8 中 ， 多 个 不 同 的 销售 代表 都 可 以 完成 任 
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务 Ti。WfiMS 可 以 使 用 一 个 算法 在 各 代理 之 间作 出 选择 ， 以 平衡 各 代理 之 间 的 负载 。 为 

方便 这 样 的 分 配 ， 每 个 代理 可 能 与 当前 赋 这 项 任务 (来 自 不 同 的 处 于 活动 状态 的 工作 流 ) 

的 工作 表 相 关联 。 

“任务 的 激活 ”WfMS 监 视 每 个 任务 的 物理 状态 和 逻辑 状态 ， 当 状态 发 生变 化 时 ， 由 它 决 

定 是 否 满足 启动 新 任务 的 条 件 。( 前 面 的 任务 都 完成 了 吗 ? 所 有 的 输出 信息 对 这 项 任务 

可 用 吗 ? ) 它 选择 并 通知 已 被 选中 的 代理 ， 并 把 任务 加 入 其 工作 列表 。WfMS 还 对 逻辑 

和 物理 失败 的 情形 作出 评价 ， 必 要 时 启动 补偿 任务 。 

“状态 的 维持 ”假设 执行 任务 的 服务 器 为 每 个 任务 产生 的 结果 提供 持久 性 服务 ， 唯 一 与 持 

入 性 相关 的 问题 就 是 WfMS 自 身 的 状态 。 如 果 它 的 状态 与 各 任务 的 输入 输出 都 能 持久 维 

持 ， 那 和 在 系统 骨 澳 时 ，WfMS 就 能 饮 复 执行 。 这 样 的 恢复 称 为 向 前 恢复 forward 

recovery ) 。 

* 过滤 ” 当 一 个 任务 的 输出 信息 作为 另 一 个 任务 的 输入 时 ， 有 必要 将 这 些 信息 重新 格式 化 。 

WfMS 为 实现 这 一 目标 提供 过 滤 。 注 意 ， 一 个 任务 的 输入 可 能 是 由 先前 的 多 个 任务 提供 

的 。 在 一 个 任务 开始 启动 前 ，WfMS 要 确保 当前 所 有 输入 可 用 并 且 格 式 正确 。 而 且 ， 过 

滤器 还 可 以 抽取 出 WfMS 所 用 的 信息 。 

“可 恢复 队列 ”可 恢复 队列 可 以 被 WfMS 当 作用 来 存储 活动 工作 流 中 任务 的 信息 的 机 制 以 

及 任务 的 排队 机 制 。 

当 一 个 活动 比较 复杂 且 必 须 满足 特定 的 业务 规则 时 ， 工 作 流 活动 的 规格 说 明 特 别 重要 。 
例如 ， 使 用 分 类 订购 系统 的 企业 管理 可 能 有 这 样 的 规则 : 没有 通过 信用 检查 的 顾客 所 订购 的 
商品 是 不 能 运送 的 。 工 作 流 中 包含 这 样 的 规则 后 ， 从 管理 上 就 能 确保 即使 一 天 启动 很 多 活动 
实例 (或 许 经 最 简单 的 培训 后 使 用 人 作 代 理 )， 但 每 个 实例 都 是 按 已 有 规则 来 执行 的 。 为 更 进 
一 步 地 与 业务 规则 一 致 ， 很 多 工作 流 的 任务 涉及 书面 批准 及 先前 任务 中 其 他 活动 的 管理 。 


21.4 参考 书目 


平坦 事务 的 基本 概念 已 经 发 展 了 一 段 时 间 ， 早 期 的 描述 包含 在 [Eswaran et al. 1976,Gray 1981,Gray 
et al. 1976]， 一 个 更 早 的 实现 在 [Gray 1978] 中 介绍 。 最 近 的 全 面 描 述 在 [Gray and Reuter 1993,Lynch et 
al. 1994,Bernstein and Newcomer 1997] 中 可 以 找到 。 存 储 点 在 [Astrahan et al. 1976] 中 有 所 介绍 。 多 数据 
库 上 的 分 布 式 事务 的 相关 问题 在 [Breitbart et al. 1992] 中 进行 了 简要 介绍 。 候 套 事 务 是 在 [Moss 1985] 中 提 
出 的 。 特 殊 的 幅 套 事务 模型 是 在 [Moss 1985,Beeri et al. 1989,Fekete et al. 1989,Weikum and Schek 
1991 ‚Garcia-Molina et al. 1991] 中 介绍 的 。 代 套 事务 是 在 [Transarc 1996] 所 介绍 的 Encina TP 监控 器 中 实现 
的 。 多 级 事务 在 多 篇 论文 中 都 有 所 涉及 ， 包 括 [Weikum 1991,Beeri et al. 1989,Beeri et al. 1983,Moss 
1985]。 补 偿 事务 的 讨论 在 [Korth et al. 1990] 中 可 以 找到 ， saga 是 在 [Garcia-Molina and Salem 1987] 介 绍 
的 。 一 些 扩展 事务 模型 的 例子 包括 ConTracts[Reuter and Wachter 1991], ACTA[Chrysanthis and 
Ramaritham 1990] 和 FLEX[Elmagarmid et al. 1990]。 多 个 事务 模型 的 比较 可 参阅 [Elmagarmid 1992], H 
展 事务 模型 的 新 发 展 能 在 [Jajodia and Kerschberg 1997] 中 找到 。 

工作 流 管理 的 概要 介绍 能 在 [Georgakopoulos et al. 1995,Khoshafian and Buckiewicz 1995 ,Bukhres and 
Kueshn,Eds. 1995,Hsu 1995] 中 找到 。 两 个 主要 问题 得 到 了 极 大 的 关注 : 适合 工作 流 的 事务 模型 的 开发 和 
工作 流 规 格 说 明 语 言 的 开发 。 可 以 从 [Rusinkiewicz and Sheth 1994,Alonso et al. 1996 ,Georgakopoulos et 
al. 1994,Alonso et al. 1997,Worah and Sheth 1997,Kamath and Ramamritham 1996] 中 找到 这 些 问 题 的 讨 
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论 。 如 果 把 业务 规则 作为 工作 流 的 一 部 分 ， 会 出 现 更 多 复杂 的 问题 。 首 先 ， 规 格 说 明 语言 必须 丰富 足以 
定义 这 些 规 则 ， 第 二 ， 工 作 流 必须 遵守 这 些 规则 ， 这 是 一 个 很 大 的 进步 。 为 让 工作 流 正确 执行 ， 很 多 研 
究 组 对 工作 流 正式 的 定义 方法 和 算法 进行 了 研究 ， 部 分 研究 成 果 可 参考 [Orlowska et al. 1996,Attie et al. 
1993,Wodtke and Weikum 1997,Singh 1996,Attie et al. 1996,Davulcu et al. 1998,Adam et al. 1998,Hull et 
al. 1999,Bonner 1999 ]。Workflow Management Coalition 已 经 开始 另 一 个 重要 的 问题 一 一 工作 流 之 间 的 
互 操作 方面 的 研究 ， 并 在 [Workflow Management Coalition 2000] 中 发 布 多 个 标准 。 


21.5 练习 


21.1 本 章 12.1 节 描述 的 学 生 缴 费 系统 既 可 以 采用 在 每 100 名 学 生 后 产生 存储 点 的 单个 事务 的 结构 ， 也 可 
以 采用 在 每 100 学 生 后 有 提交 点 的 链 式 事务 结构 。 试 解释 在 为 每 一 位 学 生 打印 账单 时 ， 这 两 种 结构 
在 执行 时 语义 上 的 差别 。 

21.2 试 解释 在 下 列 两 个 事务 模型 在 异常 中 止 、 提 交 、 回 退 、 隔 离 性 方面 的 差异 : 
a. 含 一 系列 存储 点 的 事务 和 链 式 事务 。 
b. 含 一 系列 存储 点 的 事务 和 由 一 系列 串 行 执行 子 事务 组 成 的 嵌 套 事务 。 
c 含 一 系列 存储 点 的 事务 和 由 可 恢复 队列 链接 的 一 系列 事务 。 
d. 一 系列 链 式 事务 和 由 可 串 行 调度 子 事务 组 成 的 幅 套 事务 。 
e. 一 系列 链 式 事务 和 由 可 恢复 队列 链接 的 一 系列 事务 。 
f. 由 可 恢复 队列 链接 的 一 系列 事务 和 由 串 行 执行 的 子 事务 组 成 的 嵌 套 事务 。 
g 由 并 发 执行 的 兄弟 事务 集 组 成 的 嵌 套 事务 和 由 并 发 执行 的 同 级 子 事务 集 组 成 的 分 布 式 事务 。 
h. 由 串 行 执行 的 子 事务 组 成 的 伐 套 事务 和 多 级 事务 。 

21.3 把 12.6 节 给 出 的 学 生 注 册 系 统 中 的 注册 事务 分 解 成 并 发 伐 套 事务 。 

21.4 把 12.6 节 给 出 的 学 生 注 册 系 统 中 的 注册 事务 重新 设计 成 为 多 级 事务 。 

21.5 怎样 才能 把 ATM 系 统 上 的 取款 事务 构建 为 由 并 发 子 事务 组 成 的 嵌 套 事务 。 

21.6 a. 试 解释 书 中 所 讨论 的 两 种 链 在 语义 上 的 差别 。 
b. 它们 中 的 哪 一 种 可 以 在 SQL 内 实现 ? 
c. 试 举 出 一 个 应 用 的 例子 ， 在 该 应 用 中 第 二 种 方法 更 为 适用 。 

21.7 试 解释 如 何 使 用 一 个 可 恢复 队列 让 学 生 注 册 系 统 与 学 生 缴费 系统 相 接 。 

21.8 试 举 出 三 个 使 用 可 恢复 队列 但 不 要 求 隔离 性 的 应 用 实例 。 

21.9 试 解释 不 使 用 可 恢复 队列 时 ， 完 成 打印 操作 的 困难 。 假 设 事务 在 提交 前 可 以 一 直 等 到 成 功 打 印 
为 止 。 

21.10 考虑 在 21.3.2 节 讨论 的 提取 现金 的 现实 事务 。 在 现实 事务 执行 前 、 执 行 期 间 和 执行 后 的 每 一 个 时 
刻 系统 都 有 可 能 崩 涡 ， 描 述 系统 (恢复 后 ) 如 何 确定 现金 是 否 被 取 走 。 讨 论 现 金 取款 机 制 本 身 也 
可 能 失败 的 几 种 情况 ， 而 且 这 种 情况 下 系统 不 能 判断 现金 是 否 被 取 走 。 

21.11 试 解释 在 什么 情况 下 ， 事 务 中 每 一 条 SQL 语 句 的 执行 与 伐 套 子 事务 相似 。 

21.12 说 明 如 何 将 第 1 章 第 一 段 描述 的 确定 信用 卡 的 合法 性 的 事务 构建 为 一 个 分 布 式 事务 。 

21.13 将 学 生 注册 系统 和 缴费 系统 (包括 伙食 和 住宿 缴费 ) 集成 在 一 起 ， 这 两 个 系统 的 数据 库 驻 留 在 不 
同 的 服务 器 上 ， 因 此 ， 集 成 后 的 系统 是 分 布 式 的 。 运 用 你 的 想象 能 力 : 
a. 举 出 这 个 系统 的 全 局 数据 库 上 的 两 个 全 局 完整 性 约束 的 例子 。 - 
b. 举 出 都 访问 数据 库 的 两 个 事务 。 

21.14 试 把 大 学 的 人 学 办 公 室 接纳 新 生 的 过 程 描述 为 一 个 工作 流 。 把 这 一 过 程 分 解 成 一 些 任务 ， 用 类 似 
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于 21-8 的 图 来 描绘 这 些 任 务 之 间 的 相互 作用 。 
21.15 考虑 一 个 在 两 个 银行 之 间 转 账 的 事务 。 它 可 以 分 解 为 两 个 子 事务 : 从 第 一 个 账户 中 取款 和 将 款项 
划 入 第 二 个 账户 。 试 描述 这 个 过 程 在 层次 化 事务 模型 和 对 等 事务 模型 中 如 何 实现 。 
21.16 试 解释 嵌 套 事务 如 何 使 用 存储 点 和 过 程 调 用 实现 。 假设 每 “个 子 事务 的 孩子 事务 不 会 并 发 执行 
21.17 试 描述 一 个 工作 流 和 一 个 扩展 事务 的 相似 之 处 和 不 同 之 处 。 
21.18 学 生 注册 系统 中 的 一 次 会 话 能 否 被 看 作 一 个 扩展 事务 ? 说 明 你 的 理由 。 


第 22 章 事务 处 理 系统 的 体系 结构 


事务 处 理 系 统 是 现 有 最 大 的 软件 系统 之 一 ， 它 们 应 用 在 广泛 的 应 用 领域 中 ， 因 此 对 它们 
的 要 求 差 别 也 很 大 。 一 种 极端 的 情况 是 单 用 户 系统 访问 一 个 本 地 数据 库 ， 而 另 一 种 极端 的 情 
况 是 多 用 户 系统 ， 在 这 样 的 系统 中 ， 一 个 事务 要 访问 分 布 在 网 络 上 异 构 的 多 个 资源 管理 器 ， 
每 一 秒 可 能 有 成 千 上 万 个 事务 在 执行 。 许 多 这 样 的 系统 都 有 严格 的 性 能 要 求 ， 这 些 系统 是 企 
业 发 展 的 基础 。 | 

为 创建 和 维护 这 样 一 个 复杂 的 系统 ， 将 其 分 解 为 完成 不 同 任务 的 功能 模块 是 很 有 必要 的 。 
在 本 章 中 ， 我 们 将 探讨 这 些 系统 中 的 模块 化 结构 ， 从 最 简单 的 开始 ， 然 后 逐步 增加 结构 的 复 
杂 性 。 我 们 将 描述 各 种 模块 必须 完成 的 任务 ， 说 明 这 些 模块 是 怎样 构成 的 ， 并 解释 它们 之 间 
的 通信 方式 。 


22.1 集中 式 系统 中 的 事务 处 理 


在 集中 式 事务 处 理 系统 中 ， 所 有 的 模块 都 驻 留 在 一 台 计算 机 上 。 例 如 ， 为 一 个 用 户 服务 
的 计算 机 或 工作 站 ， 或 一 台 连 有 多 个 终端 为 多 个 用 户 提供 并 发 服务 的 主机 。 我 们 分 别 对 这 两 
种 情况 进行 讨论 。 
22.1.1 单 用 户 系统 的 组 织 


图 22-1 显 示 的 是 一 个 用 户 的 事务 处 理 系统 在 一 台 PC 机 或 工作 站 上 可 能 的 组 织 形式 。 用 户 
模块 完成 表示 和 应 用 服务 (presentation and application service ) ， 表 示 服 务 通常 是 由 应 用 程序 
生成 器 创建 的 ， 这 已 经 在 3.4 节 进行 过 描述 。 它 在 屏幕 上 显示 表单 ， 并 通过 表单 处 理 从 用 户 和 
计算 机 之 间 的 信息 流 。 一 个 典型 的 循环 活动 开始 于 显示 表单 的 表示 服务 ， 在 表单 上 ， 用 户 在 
文本 框 中 输入 信息 ， 然 后 单 击 鼠 标 或 者 某 个 按钮 。 表 示 服 务 把 单 击 作为 一 个 事件 ， 并 调用 相 
关 程序 ， 这 样 的 程序 在 3.6 节 被 称 为 事件 程序 (event program )。 表 示 服 务 把 GUI 上 输入 到 文本 
框 中 的 信息 传递 到 事件 程序 ， 由 事件 程序 来 完成 应 用 服务 。 程 序 检查 没有 在 模式 中 定义 的 完 
整 性 约束 ， 并 按照 企业 的 规则 执行 一 系列 的 步 又， 适当 地 更 新 数据 库 。 


集中 式 系统 








图 22-1 单 用 户 事务 处 理 系 统 





为 完成 应 用 服务 ， 事 件 程 序 必 须 与 数据 库 服务 器 通信 。 例 如 ， 在 学 生 注册 系统 中 负责 课 
程 注册 的 事件 程序 ， 必 须 确保 学 生 已 经 学 完了 预备 课程 ， 并 且 必 须 把 学 生 的 名 字 添 加 到 班级 
花 名 册 中 去 。 它 访问 数据 库 的 请 求 可 能 定义 在 能 人 式 SQL 语 名 中， 这 些 SQL 语句 被 发 送 到 数 
据 库 服务 器 ， 数 据 库 服务 器 将 请 求 转换 成 一 系列 访问 数据 库 的 读 写 操作 命令 (数据库 存储 在 
大 容量 的 存储 设备 上 )。 这 些 命令 由 操作 系统 来 执行 。 

注意 ， 用 户 并 不 直接 与 数据 库 服务 器 交互 ， 而 是 通过 调用 事件 程序 ， 由 事件 程序 向 数据 
库 服 务 器 发 送 请 求 。 让 用 户 直接 访问 数据 库 服 务 器 (如 通过 执行 指定 的 SQL 语句 ) 是 危险 的 ， 
因为 粗心 的 或 恶意 的 用 户 容易 通过 写 人 错误 的 数据 来 破坏 数据 库 的 完整 性 。 即 使 只 人 允许 用 户 
读数 据 也 有 缺陷 。 一 方面 ， 构 建 一 个 SQL 查询 语句 返回 用 户 想 要 的 信息 不 是 一 件 容易 的 事 。 
另 一 方面 ， 数据库 中 可 能 有 不 允许 用 户 看 到 的 信息 ， 如 一 名 学 生 的 成 绩 信息 不 能 被 其 他 学 生 
看 到 ， 但 教师 却 可 以 访问 学 生 的 成 绩 信 息 。 

要 求 用 户 必须 使 用 由 应 用 程序 (假设 用 户 不 能 臭 改 它们 ) 所 提供 的 事件 程序 来 间接 地 访 
问 数 据 库 可 以 解决 这 个 问题 。 这 些 程序 是 由 应 用 程序 员 所 实现 的 ， 他 们 设计 这 些 程序 来 验证 
对 服务 器 的 访问 是 正确 的 和 适当 的 。 

尽管 事件 程序 (或 其 一 部 分 ) 可 以 被 视 为 事务 ， 但 此 时 并 不 要 求 它 具 有 事务 处 理 系 统 的 
全 部 功能 。 例 如 ， 单 用 户 系 统一 次 只 调用 一 个 事务 ， 因 此 自动 保持 隔离 性 。 但 保证 原子 性 和 
持 入 性 的 机 制 仍然 是 必要 的 ， 不 过 这 些 机 制 实现 起 来 相对 简单 ， 因 为 同一 时 间 只 有 一 个 事务 
在 执行 。 

尽管 有 人 认为 单 用 户 系统 太 简 单 ， 可 以 不 包含 在 事务 处 理 系统 中 ,但 它 表明 在 所 有 系统 
.中 必须 提供 两 个 必要 的 服务 : 表示 服务 和 应 用 服务 。 这 是 我 们 将 要 讨论 的 。 


22.1.2 集中 式 多 用 户 系统 的 组 织 


支持 任何 规模 企业 的 事务 处 理 系统 必 须 允 许多 个 用 户 从 多 个 地 点 对 它 进行 访问 。 这 样 系 
统 的 早期 版 本 使 用 了 连接 到 一 台中 央 计 算 机 的 终端 。 在 终端 和 计算 机 局 限 在 一 个 小 区 域内 
(如 一 由 建筑 物 内 ) 的 情况 下 ， 可 以 通过 硬件 连接 来 进行 通信 。 不 过 ， 在 大 多 数 情况 下 ,终端 
分 布 在 远程 地 点 ， 它 们 与 计算 机 的 通信 是 通 过 电话 线 来 完成 的 。 早 期 系统 和 当前 多 用 户 系统 
的 主要 区 别 是 终端 是 “ 哑 ” 终 端 ， 即 没有 计算 能 力 。 它 们 作为 输入 输出 设备 来 进行 服务 ， 为 
用 户 提供 简单 的 文本 接口 。 图 22-1 的 表示 服务 ( 除 此 之 外 都 内 置 到 终端 硬件 中 ) 是 最 小 的 ， 
且 必 须 在 中 心地 点 执行 。 当 然 ， 这 样 的 系统 在 地 理 上 可 能 是 分 布 的 ， 但 通常 不 认为 它们 是 分 
布 式 系统 ， 因 为 所 有 的 计算 和 智能 业务 都 驻 留 在 同一 地 点 。 

引入 多 用 户 处 理 系统 主要 源 于 事务 的 发 展 和 ACID 性 质 的 要 求 。 因 为 多 个 用 户 并 发 访问 系 
统 ， 必 须 有 一 种 方法 将 用 户 交 互 彼此 隔离 。 相 对 于 个 人 数据 库 ， 因 为 现在 的 系统 对 企业 来 说 
至 关 重要 ， 所 以 原子 性 和 持久 性 变 得 更 加 重要 。 | 
、 图 22-2 显 示 的 是 早期 多 用 户 处 理 系统 的 组 织 。 用 户 模 块 包含 表示 服务 和 应 用 程序 ， 运 行 
在 中 心地 点 。 因 为 多 个 用 户 并 发 执行 ， 所 以 每 个 用 户 模块 在 独立 过 程 中 执行 。 这 些 过 程 的 执 
行 是 异步 的 ， 它 们 可 能 随时 向 数据 库 提交 服务 请 求 。 例 如 ， 当 服务 器 为 一 个 应 用 程序 执行 
SQL 语句 的 请 求 提供 服务 时 ， 另 一 个 应 用 程序 可 能 正在 提交 执行 其 他 SQL 语句 的 请 求 。 高 级 
数据 库 服务 器 能 同时 为 多 个 这 样 的 请 求 服 务 ， 并 保证 每 个 SQL 语句 作为 隔离 的 和 原子 的 单元 
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se 集中 式 系统 

图 22-2 集中 式 多 用 户 事务 处 理 系统 
但 这 并 不 足以 确保 不 同 用 户 之 间 的 交互 是 隔离 的 。 为 提供 隔离 性 ， 应 用 程序 需要 运用 事 
务 的 概念 。 因 此 ， 事 务 支 持 模块 在 服务 器 上 提供 ， 以 执行 begin_transaction 、commit 和 


rollback 这 样 的 命令 ， 从 而 提供 原子 性 、 隔 离 性 和 持久 性 。 模 块 还 包括 并 发 控制 和 日 志 ， 在 后 
面 几 章 我 们 将 详细 讨论 这 些 内 容 。 


22.2 分 布 式 系统 上 的 事务 处 理 


现代 事务 处 理 系 统 通常 在 分 布 式 的 硬件 上 实现 ， 这 些 硬件 包括 多 个 地 理 位 置 上 分 布 的 独 
立 计 算 机 。ATM 机 是 与 银行 计算 机 分 离 的 ， 售 票 代理 点 的 计算 机 是 与 航班 预定 主 系统 相 分 离 
的 。 在 有 些 情况 下 ， 应 用 可 以 与 存储 在 不 同 计算 机 上 的 多 个 数据 库 通信 。 计 算 机 连接 在 一 个 
网 络 上 ， 各 模块 分 布 在 任意 的 地 点 ， 它 们 以 一 种 统一 的 方式 交换 消息 。 

这 些 系统 的 体系 结构 是 基于 C/S 模 型 的 。 利 用 分 布 式 硬件 ， 客户 机 和 服务 器 模块 不 必 处 在 
同一 个 地 点 。 数 据 库 服务 器 的 分 布 可 能 取决 于 以 下 一 些 因素 。 

“通信 和 帝 用 和 响应 时 间 最 小 化 ”例如 ， 一 个 工业 系统 是 由 中 心 办 公 室 、 仓 库 和 生产 车 间 组 

成 的 。 如 果 大 多 数 访问 员工 记录 的 事务 是 在 中 心 办 公 室 启动 的 ， 那么 这 些 记录 就 可 以 保 

存在 本 地 ， 而 库存 记录 则 可 以 保存 在 仓库 。 

“ 数据 的 所 有 权 和 安全 性 ”例如 ， 在 每 个 支行 办 公 室 都 有 计算 机 的 分 布 式 银行 系统 中 ， 支 

行 可 能 要 求 账户 信息 保存 在 自己 本 地 的 计算 机 上 。 

。 计算 和 存储 设备 的 可 用 性 ”例如 ， 一 个 包含 多 个 大 容量 存储 设备 的 复杂 数据 库 服 务 器 只 

能 处 在 一 个 地 点 。 

记 住 ， 在 分 布 式 系统 中 ， 不 同 的 软件 模块 处 在 不 同 的 计算 机 上 。 当 事务 处 理 系统 是 分 布 
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式 的 时 候 ， 它 的 数据 库 部 分 (database portion) 可 以 是 集中 式 的 ， 也 就 是 说 ， 可 以 利用 驻 留 
在 一 台 计 算 机 或 不 同 计 算 机 上 的 多 个 数据 库 服 务 器 。 因 此 ， 事 务 处 理 系 统 可 以 是 分 布 的 
(distributed), 但 有 一 个 集中 式 的 数据 库 。 


22.2.1 分 布 式 系统 的 组 织 


分 布 式 事务 处 理 系统 的 组 织 是 由 图 22-2 所 示 的 多 户 系统 发 展 而 来 的 。 第 一 步 ， 把 终端 赫 
换 成 客户 计算 机 ， 这 样 ， 负 责 表示 服务 和 应 用 服务 的 用 户 模块 位 于 客户 机 上 ， 它 与 数据 库 服 
务 器 通信 。 这 种 结构 称 为 两 层 模型 (two-tiered model)。 图 22-3 展 示 拥 有 集中 式 数 据 库 的 分 布 
式 处 理 系统 的 组 织 。 应 用 程序 启动 事务 ， 如 图 22-2 所 示 ， 事 务 由 事务 支持 模块 来 处 理 ， 以 确 
保 原 子 性 和 隔离 性 。 
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图 22-3 ,两 层 的 多 用 户 分 布 式 事务 处 理 系 统 


数据 库 服务 器 可 以 提供 一 个 SQL 接口 ， 以 便 客户 机 上 的 应 用 程序 向 数据 库 服务 器 发 送 执 
行 特定 SQL 语句 的 请 求 。 但 在 客户 机 直接 使 用 这 样 的 接口 时 ， 会 出 现 几 个 重要 的 问题 。 一 个 
问题 就 是 数据 库 完整 性 的 处 理 。 对 单 用 户 系统 ， 我 们 考虑 的 是 处 在 客户 端的 客户 机 可 能 不 安 
全 和 不 可 靠 。 例如， 一 个 错误 的 应 用 程序 可 能 通过 发 送 一 条 不 正确 的 更 新 语句 破坏 数据 库 的 
完整 性 。 

另 一 个 重要 的 问题 与 网 络 通信 和 系统 处 理 大 量 客户 的 能 力 有 关 。 用 户 可 能 希望 执行 SQL 
语句 来 扫描 一 张 表 ， 这 导致 将 表 中 所 有 的 数据 从 数据 库 服务 器 传送 到 客户 机 上 。 因 为 这 些 机 
器 是 分 布 的 ， 即 使 在 事务 执行 的 结果 中 包含 的 信息 很 少时 ， 也 要 求 大 量 的 网 络 通信 。 当 不 得 
不 处 理 这 样 的 要 求 时 ， 网 络 只 支持 少量 的 客户 。 

解决 这 个 问题 的 办 法 是 采用 存储 过 程 。 与 发 送 单个 SQL 语句 相反 ,客户 机 上 的 应 用 程序 
要 求 数据 库 服务 器 执行 某 个 存储 过 程 。 实 际 上 ， 应 用 程序 现在 有 高 级 的 或 更 加 抽象 的 数据 库 
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接口 。 考 虑 银行 的 数据 库 服务 器 ， 它 可 能 为 应 用 程序 提供 deposit() 和 withdraw() 存 储 过 程 。 
存储 过 程 有 以 下 几 个 优点 : 
。 它们 被 假设 是 正确 的 ， 在 数据 库 服务 器 上 可 以 保持 完整 性 。 在 客户 机 上 运行 的 应 用 程序 
禁止 提交 单个 SQL 语句 ， 因 为 客户 机 只 能 通过 存储 过 程 访问 数据 库 ， 因 而 一 致 性 也 得 到 
保护 。 
* 一 个 过 程 的 SQL 语 句 可 以 事先 写 好 ， 因 而 执行 效率 比 解释 代码 更 高 。 
“服务 提供 商 能 更 加 容易 地 授权 用 户 执行 特定 的 应 用 功能 。 例 如 ， 只 有 银行 出 纳 才 能 给 出 
有 效 的 支票 ， 而 不 是 顾客 。 在 单个 SQL 语句 级 ， 管 理 授权 是 困难 的 。 取 款 事务 可 能 使 用 
与 产生 有 效 支 票 事务 相同 的 SQL 语句 ， 通 过 拒绝 顾客 直接 访问 数据 库 来 解决 授权 问题 ， 
相反 ， 人 允许 它 执 行 取款 存储 过 程 却 不 允许 它 执 行 有 效 支票 的 存储 过 程 。 
* 通过 提供 更 加 抽象 的 服务 ， 网 络 通信 的 信息 量 减少 。 在 客户 机 上 的 应 用 程序 和 数据 库 服 
务 器 之 间 ， 不 传递 中 间 变 量 和 单个 SQL 语 句 的 执行 结果 ， 所 有 的 中 间 结 果 由 数据 库 服务 
器 上 的 存储 过 程 来 处 理 ， 只 有 初始 变量 和 最 终结 果 通过 网 络 传输 。 这 就 是 以 上 的 表 扫描 
完成 的 方式 。 这样， 数据 通信 量 减 少 ， 可 以 有 更 多 的 顾客 得 到 服务 ， 但 数据 库 服务 器 必 
须 有 足够 的 能 力 来 处 理 存储 过 程 所 要 求 的 额外 工作 。 
1. 三 层 模 型 
为 客户 机 提供 更 高 层次 服务 的 思路 可 更 进一步 实现 。 对 照 图 22-3 的 两 层 系 统 ， 图 22-4 展 示 
的 是 分 布 式 事务 处 理 系统 的 三 层 模型 (three-tiered model)。 用 户 模块 可 以 分 成 表示 服务 器 和 
应 用 服务 器 ， 它 们 在 不 同 的 计算 机 上 执行 。 客 户 端的 表示 服务 集成 用 户 的 输入 信息 对 信息 的 
有 效 性 进行 检查 ( 如 类 型 检查 )， 然 后 发 送 请 求 消息 给 应 用 服务 器 ， 在 网 络 的 某 个 地 方 执行 。 
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客户 机 应 用 服务 器 数据 库 服务 器 
图 22-4 三 层 的 分 布 式 事务 处 理 系统 
应 用 服务 器 执行 与 请 求 的 服务 相关 的 应 用 程序 。 和 以 前 一 样 ， 该 程序 实现 企业 的 规则 ， 
依次 检查 必须 满足 的 条 件 ， 调 用 数据 库 服务 器 上 相应 的 存储 过 程 来 完成 服务 请 求 。 应 用 程序 
把 请 求 的 服务 当 作 任务 序列 。 因 此 ， 在 12.6.2 节 给 出 的 学 生 注册 系统 设计 中 ， 在 执行 注册 课程 
的 任务 之 前 ， 注 册 事务 检查 该 课程 是 否 提 供 ， 学 生 是 否 修 完 所 有 的 预备 课程 ， 且 学 生 选 修 的 
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课程 总 数 没 有 超过 限制 。 

每 个 任务 可 能 要 求 复杂 程序 的 执行 ， 每 个 程序 可 能 是 数据 库 服务 器 上 的 一 个 存储 过 程 。 
应 用 程序 控制 事务 的 边界 ， 使 过 程 在 事务 内 部 执行 。 并 且 ， 它 鼓励 任务 重用 ， 即 如 果 任 务 被 
选择 来 执行 通用 的 有 用 功能 ， 它 们 能 作为 不 同 应 用 程序 的 组 件 来 调用 。 一 般 情况 下 ， 事 务 是 
分 布 的 ， 应 用 程序 被 作为 根 ， 存 储 过 程 是 在 不 同 服务 器 上 执行 的 子 事务 的 组 成 部 分 。 这 样 ， 
就 需要 更 多 精心 设计 的 事务 支持 。 我 们 将 在 22.3.1 节 讨论 。 

应 用 可 以 当 作 工 作 流 ( 见 21.3.4 节 )， 它 由 必须 按 特定 顺序 (尽管 这 种 情况 下 所 有 的 任务 都 
是 计算 型 的 ) 执 行 的 一 个 任务 集合 组 成 。 应 用 服务 器 可 被 看 作 工 作 流 控制 器 ， 它 控制 任务 流 ， 
按照 用 户 的 要 求 执行 。 

图 22-4 展 示 有 多 个 客户 机 的 应 用 服务 器 。 因 为 每 个 客户 机 请 求 的 服务 都 要 花 一 定时 间 ， 
多 个 其 他 客户 请 求 会 被 挂 起 。 因 此 ， 应 用 服务 器 必须 并 发 处 理 请 求 以 维持 操作 性 能 。 例 如 ， 
它 可 以 是 多 线程 的 (multithreaded) 。 ， 每 个 线程 处 理 一 个 客户 。 通 过 使 用 线程 ， 能 避免 过 多 
地 为 每 个 客户 创建 过 程 带 来 的 开销 。 这 样 ， 当 客户 机 数量 增加 时 ， 系 统 规模 可 以 更 好 。 

如 果 有 多 个 客户 机 ， 可 能 存在 应 用 服务 器 的 多 个 实例 。 每 个 实例 可 能 驻 留 在 不 同 的 计算 
机 上 ， 每 台 计 算 机 可 能 与 不 同 的 客户 子 集 相连 接 。 例 如 ， 一 台 应 用 服务 器 和 它 服 务 的 客户 可 
能 在 地 理 位 置 上 是 相 邻 的 。 

在 一 些 组 织 中 ， 实 现 应 用 程序 调用 的 任务 的 存储 过 程 被 移出 数据 库 服务 器 ,在 称 为 事务 
服务 器 (transaction server) 的 模块 里 执行 ， 如 图 22-5 所 示 襄 为 最 小 化 网 络 通信 ， 事 务 服务 器 
通常 位 于 与 数据 库 服 务 器 物理 上 相近 的 计算 机 上 ， 而 应 用 服务 器 位 于 接近 用 户 地 点 。 事 务 服 
务 器 现在 可 以 做 大 量 的 工作 ， 因 为 它 向 数据 库 服 务 器 提交 SQL 语句 和 处 理 返 回 的 数据 。 应 用 
服务 器 主要 负责 给 事务 服务 器 发 送 请 求 。 





数据 库 服务 器 
图 22-5 在 事务 服务 器 中 执行 任务 的 三 层 分 布 式 事务 处 理 系统 


尽管 在 图 22-5 中 没有 显示 ， 但 这 里 可 能 存在 多 个 事务 服务 器 过 程 的 实例 。 这 是 一 个 服务 
器 类 (server class) 的 例子 ， 服务器 类 在 服务 器 过 载 时 使 用 。 类 成 员 可 能 在 与 数据 库 服务 器 


应 用 服务 器 事务 服务 器 


O 在 附录 A 中 能 找到 有 关 线程 的 讨论 。 
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相连 接 的 不 同 服务 器 上 运行 ， 这 样 可 以 共享 并 发 执行 的 工作 流出 现 的 事务 负载 。 每 个 事务 服 
务 器 过 程 可 能 是 一 个 服务 器 类 实例 , 更 一 般 地 ， 可 能 有 多 个 数据 库 服务 器 存储 企业 数据 库 的 
不 同 部 分 ， 例 如 ， 一 个 服务 器 上 是 缴费 数据 库 ， 而 另 一 个 服务 器 上 是 注册 数据 库 。 某 个 事务 
服务 器 可 能 连 在 数据 库 服务 器 的 子 集 上 ， 只 能 执行 例 程 的 一 个 子 集 。 这 样 ， 一 个 应 用 服务 器 
必须 调用 合适 的 事务 服务 器 来 完成 特定 的 任务 ， 这 种 选择 调用 通常 称 作 路 由 (routing )。 分 布 
式 事务 的 应 用 程序 将 请 求 路 由 到 多 个 事务 服务 器 上 ， 如 图 22-6 所 示 。 





二 服务 器 服务 器 


图 22-6 三 层 体系 结构 中 表示 服务 器 、 应 用 服务 器 和 事务 服务 器 的 相互 连接 


在 下 列 情况 下 ， 将 事务 服务 器 和 数据 库 服务 器 分 开 是 有 益 的 : 

1) 企业 不 同 的 组 件 使 用 不 同 的 过 程 集 访问 公共 数据 库 。 把 这 些 过 程 集 分 别 放 在 不 同 的 事 
务 服 务 器 上 可 以 使 每 个 组 件 更 容易 地 控制 自己 的 过 程 。 例 如 ， 一 个 大 公司 的 账 务 系统 和 个 人 
系统 可 能 使 用 完全 不 同 的 过 程 访问 同一 数据 。 

2) 过 程 必须 访问 不 同 服务 器 上 的 不 同 数据 库 。 

3) 数据 库 服务 器 不 支持 存储 过 程 。 

4) 数据 库 服 务 器 必须 处 理 大 量 用 户 的 请 求 ， 因 而 有 可 能 产生 瓶颈 。 把 存储 过 程 从 数据 库 
机 器 移出 可 减轻 负载 。 

将 客户 机 和 应 用 服务 器 分 开 的 优点 如 下 : 

1) 客户 机 可 更 小 〈 因 而 也 更 便宜 )。 当 应 用 包含 成 千 上 万 个 客户 机 时 ， 这 一 点 尤为 重要 。 

2) 系统 维护 更 加 简单 ， 因 为 企业 规则 的 改变 (导致 工作 流程 序 的 改变 ) 局 部 化 在 应 用 服 
务 器 上 ， 不 会 反映 到 所 有 的 客户 机 上 。 

3) 系统 安全 有 所 加 强 。 因 为 用 户 不 对 应 用 服务 器 做 物理 访问 ， 因 而 不 易 改 变 应 用 程序 。 

2. 案例 研究 ; 三 层 体系 结 构 和 软件 抽象 级 别 

从 软件 工程 的 角度 来 看 ， 设 计 复 杂 应 用 的 方法 是 形成 多 级 抽象 的 体系 结构 ， 后 一 级 使 用 
前 一 级 实现 的 抽象 进行 构建 。 最 底层 应 用 完成 有 意义 的 工作 ， 在 此 基础 上 直接 构建 应 用 的 功 
能 。 在 学 生 注册 系统 中 ， 这 样 的 活动 包括 预备 课程 检查 和 缴费 。 按 照 12.6.3 节 的 实现 方法 ， 这 
层 由 代码 组 成 ， 其 方法 包括 : checkCourseOffering(), checkCourseTaken(), 
checkTimeConflict(), checkPrerequisites()ffladdRegisterInfo(), 它们 通过 SQL 语句 直接 与 数据 
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库 进 行 交 互 ， 在 数据 库 的 概念 级 的 顶层 进行 操作 。 第 二 层 抽 象 由 事务 组 成 ， 如 课程 注册 。 其 
实现 由 方法 Register() 来 表示 。 注 意 ， 这 个 方法 使 用 低级 任务 ， 如 checkCourseOffering(0 和 
checkPrerequisites()， 从 数据 库 相 关 的 角度 考虑 是 得 到 了 防护 (如 实际 的 SQL 查 询 )。 顶 层 抽 
象 包括 与 用 户 交 互 的 模块 。 例 如 ， 让 学 生 填写 选课 表单 的 GUI。 

现在 我 们 看 到 ， 应 用 设计 的 抽象 级 别 是 与 三 层 结构 体系 相对 应 的 。 例 如 ， 在 学 生 注 册 系 
统 中 ， 检 查 预备 课程 的 实际 代码 ( 即 方 法 checkPrerequisites()) 可 以 作为 存储 过 程 保存 在 数据 
库 服务 器 上 。 当 过 程 被 调用 时 ， 所 有 处 理 都 在 数据 库 服务 器 上 完成 ， 只 返回 是 或 不 是 的 回答 。 
相反 ， 如 果 预 备课 程 的 检查 在 应 用 服务 器 上 执行 ， 它 就 要 发 送 SQL 请 求 给 数据 库 ， 数 据 库 可 
能 返回 大 量 的 查询 结果 ， 增 加 网 络 阻 塞 的 可 能 。 


22.2.2 会 话 和 上 下 文 信息 


我 们 所 讨论 的 每 一 种 体系 结构 都 涉及 客户 机 与 服务 器 的 会 话 (session)。 当 两 个 实体 要 彼 
此 通信 来 完成 一 些 工作 ， 并 且 每 个 实体 保持 着 一 些 与 工作 中 的 角色 相关 的 上 下 文 状态 信息 
(context) 时 ， 这 两 个 实体 之 间 存 在 会 话 。 会 话 可 以 存在 于 不 同 的 层 。 下 面 我 们 将 予以 讨论 。 

1. 通信 会 话 

在 两 层 模 型 中 ， 表 示 服 务 器 与 数据 库 服务 器 通信 。 在 三 层 结构 模型 中 ， 表 示 服 务 器 与 应 
用 服务 器 通信 ， 应 用 服务 器 又 与 数据 库 和 事务 服务 器 通信 。 客 户 请 求 的 处 理 通常 涉及 通信 模 
块 之 间 有 效 的 和 可 靠 的 多 次 消息 交换 。 这 时 ， 通 常 建立 通信 会 话 。 会 话 要 求 每 个 通信 实体 保 
持 上 下 文 信息 ， 如 在 每 个 方向 上 发 送 的 消息 的 顺序 号 (为 了 可 靠 地 发 送 消息 )、 信 息 寻 址 、 密 
钥 和 当前 通信 的 方向 。 上 下 文 信息 保存 在 称 为 上 下 文 块 (context block) 的 数据 结构 里 。 

信息 交换 通过 建立 和 取消 会 话 来 实现 ， 这 使 得 这 些 活动 是 有 代价 的 。 结 果 ， 每 当 客户 发 
出 请 求 时 ， 表 示 服 务 器 就 建立 会 话 ， 每 当 应 用 服务 器 要 从 事务 或 数据 库 服务 器 得 到 服务 时 ， 
也 要 建立 会 话 ， 这 是 很 浪费 的 。 相 反 ， 服 务 器 之 间 应 建立 长 期 会 话 ， 在 这 段 时 间 内 ， 每 个 服 
务 器 为 客户 或 事务 传递 消息 。 

关于 会 话 ， 使 用 三 层 结构 模型 的 好 处 从 图 22-6 中 可 以 看 出 来 。 大 的 事务 处 理 系统 可 能 涉 
及 成 千 上 万 的 客户 机 和 成 百 上 千 的 事务 服务 器 。 在 最 坏 的 情况 下 ， 两 层 模型 的 每 个 客户 机 与 
每 个 事务 服务 器 都 有 一 个 连接 (长 期 的 )， 总 的 连接 数 将 是 2 的 次 军 形 式 ， 这 可 能 是 一 个 非常 
巨大 的 数字 。 建 立 这 些 连 接 的 总 开销 及 上 下 文 块 的 存储 费用 会 大 幅 增加 。 

通过 引进 应 用 层 ， 每 个 客户 机 只 需要 与 应 用 服务 器 建立 一 个 连接 ， 应 用 服务 器 只 需 与 事 
务 服务 器 建立 连接 。 但 应 用 服务 器 与 事务 服务 器 之 间 的 每 个 连接 都 能 被 应 用 服务 器 上 运行 的 
所 有 的 事务 使 用 。 更 精确 地 说 ， 如 果 有 靖 台 客户 机 ， 疡 台 应 用 服务 器 和 记 台 事务 服务 器 。 最 坏 
的 情况 下 ， 在 两 层 体系 结构 上 有 ni*n; 个 连接 ， 而 三 层 结构 上 连接 数 是 ni+nzxn3。 因为 n; 远 远 小 
于 n!， 所 以 这 大 大 减少 了 连接 数 。 因 此 三 层 体系 结构 模型 非常 适用 于 处 理 大 量 客户 机 的 系统 。 

2. 客户 机 /服务 器 会 话 

服务 器 维护 它 为 之 提供 服务 的 每 个 客户 机 的 上 下 文 信息 。 考 虑 一 个 通过 游标 访问 表 的 事 
务 。 它 执行 一 个 SQL 语句 序列 (OPEN, FETCH) 产生 一 个 结果 集 ， 检 索 其 中 的 行 。 上 下 文 
必须 保存 在 服务 器 上 ， 以 便 它 能 处 理 这 些 语句 。 因 此 ， 对 FETCH 语 句 ， 服 务 器 必须 知道 最 后 
返回 哪 一 行 。 更 一 般 地 说 ， 如 果 典 型 的 客户 交互 包含 一 系列 的 请 求 ， 服 务 器 不 想 认证 客户 ， 
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并 决定 为 哪 一 个 请 求 服务 。 

供 客户 机 /服务 器 会 话 使 用 的 上 下 文 信息 可 以 以 多 种 不 同 的 方式 保存 。 

(1) 存储 在 本 地 服务 器 

服务 器 能 在 本 地 保存 客户 机 的 上 下 文 信息 。 每 次 客户 机 发 出 请 求 时 ， 服 务 器 检查 客户 机 
的 上 下 文 ， 并 用 上 下 文 信息 解释 请 求 。 注 意 ， 当 客户 机 总 是 访问 同一 服务 器 时 ， 这 种 方法 的 
效果 很 好 。 但 当 请 求 的 服务 由 服务 器 类 的 任意 实例 提供 时 ， 必 须 谨慎 使 用 这 种 方法 。 此 时 ， 
。 后续 服务 可 能 由 不 同 的 实例 提供 ， 存 储 在 本 地 实例 中 的 上 下 文 信息 对 其 他 实例 来 说 是 不 可 访 
问 的 。 而 且 ， 当 客户 机 很 多 ,会 话 时 间 很 长 时 ， 保 持 会 话 是 沉重 的 负担 。 上 下文 信息 保持 的 
形式 经 常 与 对 等 通信 一 起 使 用 (参见 22.4.2 节 )。 

(2) 存储 在 数据 库 上 

如 果 服 务 器 是 一 个 数据 库 管理 系统 ， 那 么 上 下 文 信息 能 保持 在 数据 库 中 。 这 种 方法 可 中 
免 服务 器 类 带 来 的 问题 ， 因 为 类 的 所 有 实例 可 以 访问 同一 个 数据 库 。 

(3) 存储 在 客户 机 上 

上 下 文 信息 可 以 在 客户 机 和 服务 器 之 间 来 回 传递 。 服 务 器 完成 服务 请 求 后 给 客户 机 返回 
其 上 下 文 信息 。 客 户 机 不 会 试图 解释 上 下 文 信息 ， 而 是 将 它 保存 下 来 ， 当 下 次 发 出 请 求 时 ， 
将 它 再 传 给 服务 器 。 这 种 方法 既 能 减轻 服务 器 保存 上 下 文 信息 的 负担 ， 又 能 避免 服务 器 类 带 
来 的 问题 。 上 下 文 信息 数据 结构 的 来 回 传送 称 作 上 下 文 处 理 (context handle)。 这 种 上 下 文 信 
息 保 持 的 形式 经 常 与 过 程 调用 通信 一 起 使 用 。 

到 目前 为 止 ， 在 对 客户 机 /服务 器 上 下 文 信息 的 讨论 中 ， 我 们 主要 关注 与 一 系列 客户 机 对 
服务 器 请 求 相 关联 的 上 下 文 信息 。 更 一 般 地 ， 上 下 文 信息 必须 与 事务 关联 在 一 起 作为 一 个 束 
体 (这 可 能 包括 对 不 同 服务 器 的 多 个 请 求 ， 也 可 能 包括 多 个 会 话 )。 这 种 需求 如 图 22-7 所 示 ， 
在 这 里 ， 一 个 客户 机 与 服务 器 S1 建 立 一 个 会 话 ;与 服务 器 S2 建 立 另 一 个 会 话 。 这 两 个 服务 器 
都 使 用 服务 器 S3 来 完成 客户 机 的 请 求 。 但 问题 在 于 ， 隔 离 性 和 原子 性 是 和 作为 一 个 整体 的 事 
务 联系 在 一 起 的 ， 而 不 是 和 某 个 特定 的 会 话 联系 在 一 起 。 例 如 ， 锁 (在 第 23 章 讨论 ) 用 来 实 
现 隔离 ' S3 必 须 使 用 事务 的 上 下 文 信息 来 确定 锁 沪 它 是 在 处 理 S1 发 出 的 请 求 时 获得 的 ， 对 特 
定 的 事务 而 言 ， 可 用 于 为 同一 事 务 中 从 S2 来 的 请 求 服务 


客户 机 





服务 器 S2 


signants] { 


图 22-7| 当 两 企 服 务 器 访问 代表 同 二 个 事务 的 同 十 个 服 务 器 时 ， 必 须 保 持 事务 的 上 下 文 


22.2.3 队列 事务 处 理 


图 22-3 中 所 给 出 的 两 层 模型 称 为 以 数据 为 中 心 的 (data centered) , 而 图 2255 中 给 出 的 三 层 
模型 称 为 是 以 服务 为 中 心 的 (serviceicentered )。 在 这 两 种 情况 下 ， 客户 机 和 服务 器 都 参与 直 
接 事务 处 理 (direct transaction processing)， 即 客户 机 调用 服务 器 ， 然后 等 待 结果 。 系统 会 尽 
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快 提供 服务 ， 并 返回 结果 。 此 时 客户 机 和 服务 器 是 同步 工作 的 。 

通过 使 用 队列 事务 处 理 (queued transaction processing) 机 制 ， 客 户 机 把 请 求 插入 到 服务 
器 上 待 服务 的 请 求 队列 中 ， 然 后 做 其 他 工作 。 当 服务 器 准备 提供 服务 时 ， 就 从 队列 中 删除 请 
求 。 例 如 ， 表 示 服 务 器 的 请 求 经 常 被 插 人 到 应 用 服务 器 队列 的 前 面 ， 直 到 指定 应 用 服务 器 线 
程 来 处 理 这 个 请 求 为 止 。 在 服务 完成 后 ， 服 务 器 就 将 结果 插入 到 结果 队列 中 。 客 户 机 会 将 结 
果 从 队列 中 删除 。 因 而 ， 客 户 机 和 服务 器 异步 工作 。 

使 用 可 恢复 队列 ， 队 列 操作 是 事务 型 的 。 处 理 一 个 请 求 涉及 三 个 事务 ， 如 图 22-8 所 示 。 
在 得 到 服务 前 ， 客 户 机 通过 执行 事务 Ti 将 请 求 插入 到 队列 中 。 提 供 服务 时 ， 服 务 器 执行 事务 
T; 从 队列 中 删除 请 求 ， 并 把 结果 插入 到 应 答 队 列 中 。 最 后 ， 客 户 机 执行 事务 了 从 应 答 队 列 中 
将 结果 删除 。 比 较 图 22-8 与 图 21-7， 其 主要 差别 在 于 图 21-7 用 前 向 代理 从 请 求 队列 中 删除 请 求 
并 调用 服务 器 (被 动 地 )， 而 在 图 22-8 中 ， 由 服务 器 (主动 地 ) 来 删除 请 求 。 


Ti: 入 队 请 求 T: 出 队 请 求 











Ty: 出 队 应 答 求 队列 ， Ta 入 队 应 答 


图 22-8 排队 事务 的 处 理 涉及 二 个 队列 和 三 个 事务 


队列 事务 处 理 带 来 一 些 好 处 。 客 户 机 能 在 服务 器 忙 或 不 工作 时 输入 请 求 a 类 似 地 ， 即 使 
. 在 客户 机 因为 忙 或 不 工作 而 没有 准备 好 接收 结果 , ;服务 器 也 能 将 结果 返回 。 而 且 ， 如 果 请 求 
正在 服务 时 服务 器 崩溃， 服务 事务 会 异常 中 止 ， 请 求 又 回 到 请 求 队列 中 。 在 服务 器 重启 后 ， 
不 需要 客户 机 的 干预 ,请求 就 可 以 得 到 服务 w 最 后 ， 当 多 个 服务 器 可 用 时 ， 队 列 会 调用 算法 
平衡 所 有 服务 器 间 的 负载 。 


22.3 异 构 系 统 和 TP 监控 器 


现在 ， 许 多 事务 处 理 系统 是 异 构 的 (heterogeneous) ， 其 中 包括 多 个 厂商 的 产品 : 硬件 平 
台 、 操 作 系 统 、 数 据 库 管理 器 以 及 通信 协议 。 和 蜡 构 相对 应 ,早期 的 同 构 :(iiomogeneous) 系 
统 的 软 硬 件 来 自 一 个 厂商 ， 通 常 使 用 其 专用 接口 (proprietary interface), HA 与 自己 的 软 硬 
件 产 品 相互 连接 。 即 使 发 布 其 专用 接口 ， 这 些 专用 接口 与 系统 中 其 他 厂商 的 产品 进行 集成 时 
也 有 困难 ， 因 为 这 些 产品 使 用 不 同 的 接口 ; 

同 构 系 统 逐 渐 发 展 成 为 现在 的 异 构 系统 有 以 下 几 方面 的 原因 : 

“新 的 应 用 经 常 要求 与 原来 独立 操作 的 老 系 统 和 遗留 系统 互相 连接 。 例 如 。 近 下 年 来 所 公 
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本 中 每 个 部 门 可 能 部 有 自己 的 采购 系统 ， 现在 公司 需要 与 各 部 门 相连 接 的 全 公司 范围 的 

采购 系统 。 

。 有 很 多 厂商 供应 硬件 和 软件 组 件 ， 用 户 需要 集成 功能 最 好 的 软 硬 件 ， 而 与 厂商 无 关 。 

异 构 系统 需要 各 厂商 同意 实现 开放 接口 (open interface) ， 即 非 专 有 接口 ， 使 各 软件 能 互 
相通 信和 的 通信 和 软件。 如果 遗留 系统 (比如 一 个 老 的 采购 系统 ) .使 用 非 标准 的 、 专 有 的 接口 ， 
在 接口 之 间 就 必须 有 一 个 包装 程序 (wrapper program) 作为 接口 之 间 的 桥梁 。 

为 促进 开放 的 分 布 式 系 统 的 发 展 ， 特 别 是 事务 处 理 系统 的 发 展 ， 现 在 开发 出 多 种 被 称 为 
中 间 件 的 软件 产品 。 中 间 件 (middleware) 是 软件 ， 它 支持 C/S 之 间 的 交互 。 例 如 ， 满 足下 列 
条 件 的 软件 模块 是 中 间 件 : 

。 它 支持 不 同 的 通信 协议 。 

“分 布 式 应 用 的 安全 ， 包 括 认 证 和 加 密 。 

“ 将 一 个 模块 的 程序 和 数据 翻译 到 另 一 个 模块 中 去 。 

“ 分布 式 事务 的 原子 性 、 隔 离 性 和 持久 性 。 

因为 有 标准 的 接口 ， 所 以 这 些 软件 模块 可 以 在 不 同 的 分 布 式 应 用 中 使 用 。 

JDBC 和 ODBC (10.5 节 和 10.6 节 ) 是 两 个 中 间 件 的 例子 ， 它 允许 应 用 程序 与 不 同 厂商 的 
数据 库 服务 器 交互 。CORBA (16.6 节 ) 是 另 一 种 中 间 件 的 例子 ， 它 允许 应 用 访问 分 布 在 网 络 
上 的 对 象 。 


22.3.1 事务 管理 器 


分 布 式 事务 实现 的 主要 问题 是 全 局 原子 性 。 特 定 服务 器 上 的 原子 性 可 以 由 这 台 服务 器 来 
实现 ， 但 全 局 原子 性 需要 涉及 该 事务 的 所 有 服务 器 的 合作 ， 合 作 可 以 通过 使 用 协议 来 实现 。 

当 事 务 处 理 系统 是 同 构 系统 时 ， 实 现 全 局 原子 性 的 算法 通常 集成 到 各 厂商 提供 的 服务 器 
上 。 这 样 的 系统 有 时 也 被 称 作 TP 轻 负荷 (TP-Lite )。 在 异 构 系统 中 ， 这 样 的 算法 通常 包含 在 
不 同 的 中 间 件 模块 上 ,如 图 22-9 所 示 。 这 种 中 间 件 模块 称 作 事务 管理 器 (transaction manager), 
它 是 TP 监 控 器 的 一 部 分 (参见 22.3.2 节 )。 图 中 表示 的 是 一 个 两 层 系统 ， 也 可 以 表示 为 三 层 系 
统 。 异 构 系 统 比 同 构 系 统 更 加 复杂 ， 它 常 被 称 作 TP 重 负荷 (TP-Heavy ) 。 

在 这 两 种 情形 下 ， 支 持 全 局 原子 性 的 模块 响应 来 自 应 用 程序 的 命令 ， 该 应 用 程序 设置 分 
布 式 事务 的 边界 ， 对 子 事务 的 提交 进行 协调 。 为 达到 上 述 目的 ， 该 应 用 程序 必须 知道 何 时 事 
务 是 作为 一 个 整体 ， 何 时 开始 执行 它 的 子 事务 。 这 里 ， 我 们 就 来 描述 工作 在 TP-Heavy 系 统 中 
的 过 程 ， 因 为 系统 是 异 构 的 ， 所 以 它 依赖 于 接口 的 标准 。X/Open 标 准 AEI 就 是 这 样 一 个 标准 。 

X/Open 是 由 X/Open 有 限 公司 定义 的 ， 该 公司 是 一 个 独立 的 被 许多 大 型 的 信息 系统 供应 商 
和 软件 公司 支持 的 世界 范围 的 组 织 。 其 API 的 一 部 分 就 是 tx 接口 ， 它 支持 事务 的 概念 ， 包 括 
tx_begin()、tx_commit() 和 tx_rollback()。 这 些 过 程 从 应 用 程序 中 调用 ， 在 事务 管理 器 中 执行 
在 描述 与 分 布 式 事务 相关 的 概念 时 ， 我 们 的 讨论 基于 这 一 标准 。 

当 应 用 程序 想 让 事务 管理 器 知道 它 开 始 一 个 分 布 式 事务 时 ， 它 就 调用 tx_begin() 过 程 。 事 
务 管理 器 记录 新 的 分 布 式 事务 的 存在 ， 并 返回 一 个 标识 符 ， 该 标识 符 唯一 地 标识 该 事务 。 后 
来 ， 当 应 用 向 资源 管理 器 发 出 服务 请 求 时 ， 通 信 竺 (由 TP 监控 器 提供 ). 就 通知 事务 管理 器 ， 
有 新 的 子 事务 存在 。 
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原子 提交 协议 










+ tx begin 
tx_commit 





客户 机 数据 库 服务 器 
图 22-9 事务 能 访问 多 个 数据 库 服务 器 的 两 层 多 数据 库 事务 处 理 系 统 


应 用 通过 调用 tx_commit() 来 通知 事务 管理 器 分 布 式 事务 已 成 功 执 行 。 然 后 事务 管理 器 与 
服务 器 通信 ， 参 与 事务 执行 的 子 事务 要 么 全 部 提交 ， 要 么 全 部 异常 中 止 ， 从 而 保证 分 布 式 事 
务 的 全 局 原子 性 。 为 实现 这 一 目的 ， 使 用 原子 提交 协议 (atomic commit pi6tocol) 控 制 消息 的 
交换 。 在 这 里 ， 事 务 管理 器 通常 称 为 协调 器 (coordinator)。 在 26.2 节 ， 我们 将 讨论 最 常用 的 
原子 提交 协议 。 

每 个 这 样 的 过 程 是 一 个 函数 ， 它 返回 一 个 值 来 表示 请 求 是 失败 还 是 成 功 。 特 别 地 ， 
tx_commit() 的 返回 值 表 示 分 布 式 事务 是 提交 还 是 异常 中 止 ， 以 及 异常 中 止 的 原因 。 例 如 ， 如 
果 事务 管理 器 发 现 其 中 一 台数 据 库 服务 器 崩溃 或 到 该 服务 器 上 的 通信 被 中 断 ， 分 布 式 事务 可 
能 会 异常 中 止 。 


22.3.2 TP 监控 器 


事务 管理 器 是 能 用 来 构建 TP-Heavy 系 统 的 现成 的 中 间 件 的 例子 ，TP 监 控 器 是 这 样 组 件 的 
集合 ， 存 在 多 个 TP 监控 器 。Tuxedo 和 Encina 是 早期 的 例子 Microsoft Transaction Server 
(MTS) 是 比较 新 型 的 TP 监控 器 ，Java Transaction Server (JTS) 是 基于 TP 监控 器 的 一 个 规格 
说 明 。 所 有 这 些 产 品 都 包括 或 定义 一 个 事务 管理 器 和 一 个 独立 于 应 用 的 服务 集 ， 尽 管 在 事务 
处 理 系统 中 这 些 组 件 是 必需 的 ， 但 通常 不 由 操作 系统 提供 。 如 图 22-10 所 示 ，TP 监 控 器 可 以 视 
为 操作 系统 和 应 用 例 程 之 间 的 一 个 软件 层 。 

TP 监控 器 提供 的 服务 类 似 于 操作 系统 所 提供 的 一 些 服务 。 操 作 系 统 创建 并 发 执行 过 程 的 
抽象 ， 这 些 过 程 可 以 相互 通信 ， 操 作 系统 为 这 些 过 程 提供 对 计算 机 系统 资源 的 共享 访问 ，TP 
监控 器 基于 这 些 抽象 创建 事务 的 抽象 ， 这 些 事务 并 发 地 在 异 构 的 分 布 式 环境 下 执行 。 

下 面 这 些 服务 通常 是 由 TP 监控 器 来 提供 的 。 

1. 通信 

TP 监控 器 支持 应 用 程序 模块 使 用 的 抽象 来 相互 通信 。 这 些 抽象 是 通过 在 内 核 传递 的 分 布 








#228 FRRERARHKAH 549 


式 消息 提供 的 消息 传递 设施 传递 消息 建立 起 来 的 (参见 附录 A)。 通 常 提 供 两 种 抽象 : 远程 过 
程 调用 和 对 等 通信 。 远 程 过 程 调用 由 于 它 的 简 : 

单 性 ， 以 及 它 与 C/S 模 型 的 自然 关系 ， 经 常 被 | — SPA 一 事务 型 API 
应 用 程序 使 用 。 对 等 通信 更 加 复杂 ， 但 更 加 灵 
活 。 系 统 级 模块 倾向 于 使 用 对 等 通信 ， 以 便 使 
用 它 的 灵活 性 来 优化 性 能 。 大 多 数 与 数据 库 管 


TP 监控 器 





理 系统 的 通信 是 通过 对 等 连接 来 实现 的 。 我 们 操作 系统 
将 在 22.4 节 探讨 通信 问题 。 

2. 全 局 原子 性 和 隔离 性 物理 计算 机 系统 

TP 监控 器 的 一 个 目标 就 是 确保 全 局 原子 性 
和 隔离 性 。 分 布 式 事务 的 子 事务 可 以 在 不 同 的 图 22.10 RA ARR KES 


资源 管理 器 上 执行 ， 经 常 是 数据 库 管 理 器 本 地 实现 原子 性 和 隔离 性 ， 其 他 资源 管理 器 可 能 不 
提供 对 这 些 特 性 的 支持 。 例 如 ， 事 务 可 以 访问 文件 服务 器 上 的 几 个 文件 ， 对 文件 的 访问 应 该 
是 满足 隔离 性 和 原子 性 的 。 如 果 文 件 服务 器 不 支持 隔离 性 ， 事 务 可 以 使 用 由 TP 监控 器 提供 的 
锁 管理 器 。 锁 管理 器 中 的 锁 和 文件 服务 器 中 的 文件 相关 联 。 访 问 文件 的 事务 在 访问 文件 服务 
器 之 前 ， 要 求 对 访问 的 文件 加 锁 (通过 调用 锁 管理 器 )， 事 务 结束 后 ， 就 调用 锁 管 理 器 释放 锁 。 
如 果 所 有 事务 都 遵守 这 一 协议 ， 对 文件 的 访问 就 可 以 同步 化 ， 这 和 访问 提供 并 发 控制 的 数据 
库 服务 器 中 的 数据 项 一 样 (用 锁 实现 隔离 性 将 在 23.5 节 中 做 更 加 详细 的 讨论 )。 类 似 地 ， 如 果 
文件 服务 器 不 支持 原子 性 ， 可 以 使 用 日 志 管 理 器 。 

在 将 某 个 服务 器 上 的 局 部 隔离 性 和 局 部 原子 性 扩展 到 全 局 隔离 性 和 全 局 原子 性 有 时， 事务 
管理 器 是 很 重要 的 。 为 提供 这 服务 ， 分 布 式 事务 所 创建 的 子 事务 在 启动 时 必须 通知 事务 管 
理 器 。 因 此 ， 事 务 管理 器 的 作用 与 应 用 使 用 的 通信 抽象 紧密 相关 。 每 当 应 用 启动 新 的 子 事务 
时 (通过 第 一 次 与 一 个 服务 器 通信 ) ， 就 通知 事务 管理 器 。 因 此 ， 支 持 全 局 原子 性 涉及 事务 管 
理 器 和 通信 设备 。 这 是 一 个 复杂 的 问题 ， 我 们 将 在 22.4.1 节 分 别 讨论 。 

3. 负载 平衡 和 路 由 

大 型 事务 处 理 系统 使 用 服务 器 类 。 如 果 类 中 的 服务 器 分 布 在 网 络 上 ， 其 可 用 性 有 所 增加 ， 
因为 它们 能 并 发 执行 ， 所 以 性 能 也 得 到 提升 。 当 客户 机 调用 这 样 的 服务 时 ，TP 监 控 器 能 把 请 
求 路 由 给 类 中 的 任何 一 个 服务 器 。 有 些 TP 监 控 器 使 用 负载 平衡 作为 选择 标准 。 它 们 使 用 一 个 
循环 或 随机 算法 来 对 服务 器 上 的 负载 进行 分 配 ， 或 保留 类 中 正在 处 理 的 每 个 服务 器 会 话 信息 
(也 许 是 通过 对 等 连接 的 数量 来 衡量 的 )， 从 中 选择 负载 最 小 的 服务 器 。 当 提供 队列 事务 处 理 
时 ， 负 载 平衡 可 以 与 队列 机 制 集成 在 一 起 。 

4. 可 恢复 队列 

除 支持 队列 事务 处 理 外 ， 可 恢复 队列 通常 用 于 应 用 模块 之 间 的 异步 通信 ， 许 多 TP 监控 器 
提供 可 恢复 队列 。 

5. 安全 服务 

一 个 事务 处 理 系 统 中 的 信息 经 常 是 需要 保护 的 ， 加 密 、 认 证 和 授权 是 保护 的 基础 。 由 于 . 
这 样 的 原因 ，TP 监 控 器 经 常 支持 安全 服务 。 我 们 将 第 27 章 探讨 这 些 服务 。 
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6. 线程 

我 们 知道 ,〈 例 如 ， 与 应 用 服务 器 连接 时 ) 在 事务 处 理 系统 中 ， 线 程 能 减少 处 理 大 量 客户 
的 开销 。 但 不 是 所 有 的 操作 系统 都 支持 线程 。 这 种 情况 下 ， 有 些 TP 监控 器 提供 自己 的 线程 。 
这 样 ， 操 作 系 统 在 调度 过 程 执行 时 ， 就 不 必 考 虑 多 线程 。 在 处 理 过 程 中 ， 由 TP 监控 器 代码 选 
择 特定 的 线程 来 执行 

7. 服 务 器 的 支持 

TP 监控 器 提供 多 个 服务 器 ， 这 些 服务 器 在 事务 处 理 系 统 中 是 有 益 的 。 例 如 ， 时 钟 服务 器 
可 让 不 同 计算 机 上 的 时 钟 同步 ， 文 件 服务 器 能 像 一 般 设备 那样 提供 服务 。 

8. KEF FH 

APTER at KREBS. 

本 章 中 我 们 介绍 了 很 多 术语 ， 它 们 是 容易 混淆 的 。 下 面 我 们 对 这 些 定义 进行 回顾 。 

“事务 服务 器 ”执行 应 用 子 例 程 ， 子 例 程 完成 基本 单元 的 工作 ， 这 些 基本 的 单元 构成 整个 

应 用 程序 。 

“事务 管理 器 支持 分 布 起 事务 原子 执行 的 资源 管理 器 。 

“TP 监 控 器 提供 事务 管理 器 ， 处 于 中 间 件 的 下 层 ， 将 事务 处 理 系统 的 组 件 连 在 一 一 起 。 

“事务 处 理 系统 ”包括 TP 监 控 器 、 应 用 程序 代码 和 各 种 资源 管理 器 ， 如 数据 库 管理 系统 ， 

构成 整个 系统 。 


22.4 TP 监控 器 : 通信 和 全 局 原子 性 


在 21.2.2 节 给 出 的 常规 分 布 式 事务 模型 包括 一 组 相关 计算 , 这 些 计 算是 由 许多 模块 完成 的 ， 
各 模块 位 于 网 络 上 的 不 同 地 点 ， 相 互 之 间 可 以 进行 通信 。 例 如 ， 应 用 模块 可 以 从 数据 库 服务 
器 请 求 服务 ， 或 者 这 个 应 用 本 身 是 分 布 的 ， 应 用 模块 可 能 从 其 他 模块 请 求 服务 。 
考虑 课程 注册 应 用 程序 A，( 可 能 在 某 应 用 服务 器 上 的 事务 的 上 下 文中 执行 )， 它 调用 数据 
库 服 务 器 D, 上 的 存储 过 程 为 一 名 学 生 选 修一 门 课程 ， 然 后 调用 远程 应 用 程序 A 的 一 个 过 程 ， 
完成 这 名 学 生 的 缴费 工作 。As 又 可 以 调用 处 在 不 同 数据 库 服务 器 D, 上 的 存储 过 程 记录 费用 情 
况 。Di 和 A: 都 被 Ai 看 作 是 服务 器 (Ds 被 A, 看 作 是 服务 器 )。 但 在 这 一 意义 上 ， 只 有 D1 和 DD, 是 
资源 管理 器 ， 它 们 所 控制 的 资源 状态 必须 保持 。 尽 管 这 些 模块 之 间 的 通信 可 以 使 用 相同 的 通 
信 范 型 (因此 ， 在 这 一 章 ， 我 们 可 以 不 区 分 这 两 种 情况 )， 但 只 有 资源 管理 器 参与 原子 提交 协 
议 。 如 果 A! 在 事务 T 的 上 下 文中 执行 ， 我 们 说 事务 T 从 A 传 播 (propagate) FJA, D° 作为 
Aj 调 用 的 结果 。 | | 
尽管 消息 的 传递 是 基于 通信 完成 的 ，TP 监 控 器 通常 为 应 用 提供 几 个 高 层 通信 抽象 。 它 的 
选择 取决 于 应 用 的 类 型 。 在 一 些 应 用 中 ， 各 模块 之 间 有 严格 的 层次 结构 关系 。 例 如 ， 客 户 机 
模块 向 服务 器 模块 请 求 服务 ， 然 后 等 待 回答 。 在 这 种 情况 下 ， 利 用 模块 调用 机 制 非常 方便 。 
在 其 他 应 用 中 ， 相 互通 信 的 模块 是 对 等 的 ， 所 以 使 用 对 等 的 通信 模式 是 比较 合适 的 。 在 这 一 
© 有 时 也 用 术语 spread 或 infect。 
O 有 些 TP 监控 器 允许 违反 这 一 规划。 例如，A1 可 以 定义 A 不 包含 在 A 中 。 类 似 地 ，A; 自 身 也 可 以 定义 它 自己 
不 包含 在 T 中 。 而 且 ， 已 定义 的 命令 允许 - -个 程序 暂时 不 包含 在 当前 事务 中 ， 而 在 以 后 恢复 ， 参与 事务 的 
执行 。 
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节 中 ， 我 们 来 探讨 通信 的 抽象 及 其 实现 。 另 外 ， 我 们 还 将 对 事件 通信 进行 讨论 ， 它 对 处 理 异 
常情 况 是 非常 有 用 的 。 


22.4.1 运程 过 程 调用 


分 布 式 消息 传输 内 核 提 供 传输 工具 ， 利 用 这 种 网 络 消 息 传递 功能 可 以 支持 模块 之 间 的 通 
信 (参见 附录 A)。 但 由 于 模块 接口 的 缺陷 使 得 它 使 用 起 来 不 够 方便 。 而 调用 操作 系统 原 语 来 
实现 消息 的 收发 既 不 可 取 也 不 是 件 容易 的 事 。 用 户 喜 欢 使 用 高 级 语言 的 过 程 接 口 ， 能 从 编译 
器 提供 的 自动 类 型 检查 中 受益 。 因 此 ， 我 们 的 目标 就 是 创建 过 程 调用 工具 ， 使 得 调用 模块 
(可 能 是 远程 的 ) 中 的 一 个 过 程 和 调用 一 个 本 地 过 程 ( 该 过 程 链接 在 调用 者 的 代码 中 ) 一 样 方 
便 。 这 样 的 一 个 工具 支持 远程 过 程 调用 (Remote Procedure Call, RPC) [Birrell and Nelson 
1984,1990]. 

使 用 RPC， 分 布 式 计算 就 可 以 采用 树 型 结构 ， 因 为 一 个 模块 中 的 过 程 调用 可 以 调用 另 一 
个 模块 中 的 过 程 。 启 动 计算 的 过 程 作为 一 个 整体 被 称 为 树 的 根 (root). 

当 一 个 过 程 在 模块 中 被 调用 时 ， 局 部 变量 位 于 一 个 临时 工作 区 ， 完 成 计算 需要 的 所 有 必 
要 信息 作为 参数 传 给 过 程 。 在 计算 完成 和 过 程 返 回 后 ， 局 部 变量 的 空间 被 释放 , -因此 不 能 用 
来 存储 上 下 文 信息 。 由 于 这 个 原因 ，RPC 通 信 称 为 无 状态 的 (stateless )。 如 果 经 过 几 次 调用 
后 ， 上 下 文 信息 必须 保存 ， 调 用 模块 就 将 它 作 为 全 局 变量 保存 ， 或 者 使 用 一 个 上 下 文 处 理 机 
制 来 传递 它 (参见 22.2.2 节 ) 。 

1. 远程 过 程 调用 的 实现 

RPC 是 使 用 桩 (stuab) 来 实现 的 。 客 户 桩 是 与 客户 机 相 链接 的 例 程 ， 服务 器 桩 是 与 服务 器 
相 链 接 的 例 程 。 如 图 22-11 所 示 ， 桩 程序 作为 客户 机 和 服务 器 的 中 介 。 客 户 机 调用 服务 器 过 程 
上 时， 服务 器 过 程 使 用 过 程 的 全 局 唯一 的 名 字 。 名 字 是 系统 中 所 有 用 户 都 知道 的 字符 电 。 但 调 
用 并 不 直接 激活 过 程 。 相 反 、 它 调用 处 在 服务 器 上 的 客户 桩 (使 用 目录 服务 ， 我 们 将 在 后 面 
讨论 )， 建 立 连接 ， 然 后 把 参数 转换 成 一 种 标准 格式 。 ， 连同 被 调用 过 程 的 名 字 一 起 打包 成 调 
用 消息 ， 这 称 作 参数 序列 化 (marshaling of argument) 过 程 ， 然后 使 用 低层 通信 协议 把 消息 
发 送 给 服务 器 。 

在 图 中 ， 服 务 器 处 在 不 同 的 计算 机 上 。 服 务 器 桩 从 所 有 的 客户 接收 调用 消息 ， 并 以 一 种 
特殊 的 消息 格式 对 参数 重新 处 理 ， 转 换 成 服务 器 所 希望 的 格式 ， 然 后 使 用 标准 的 过 程 调用 
(本 地 ) 方法 调用 合适 的 过 程 。 调 用 结果 返回 给 服务 器 桩 ， 由 它 使 用 消息 传递 工具 传 回 给 客户 
机 桩 , 再 由 客户 机 桩 返回 给 客户 (客户 机 桩 是 由 使 用 常规 过 程 调用 的 客户 应 用 程序 来 激活 的 )。 
因此 ，RPC 是 高 层 通信 工具 ， 是 由 过 程 调用 机 制 耦合 消息 传递 工具 来 实现 的 。 

桩 机 制 有 很 多 优点 。 只 有 柱 和 操作 系统 接口 。 对 客户 机 和 服务 器 而 言 ， 就 好 像 是 通过 通 
常 的 过 程 调 用 来 实现 相互 之 间 的 通信 。 而 且 ， 对 服务 器 上 的 过 程 ， 桩 使 得 本 地 机 器 上 的 过 程 
调用 和 远程 机 器 上 的 过 程 调用 是 一 样 的 ， 就 像 调 用 链接 在 客户 机 代码 的 本 地 过 程 一 样 。 因 此 ; 
客户 机 的 代码 不 必 关 心服 务 器 所 处 的 物理 位 置 ， 它 使 用 同样 的 机 制 与 本 地 服务 器 和 远程 服务 
器 通信 。 最 后 ， 如 果 组 件 移动 ， 客 户 机 代码 与 服务 器 代码 是 不 需 改变 的 ， 这 一 特性 称 为 位 置 


日 ”在 另 一 种 组 织 形式 中 ， 客 户 端 并 不 进行 转换 ， 但 如 果 有 必要 ， 就 让 服务 器 端 将 接收 的 参数 转换 成 服务 器 所 
需要 的 形式 。 
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透明 性 (location transparency ) 。 
客户 过 程 服务 器 过 程 
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图 22-11 用 桩 支持 远程 过 程 调用 


在 把 客户 机 连接 到 服务 器 时 ， 必 须 考虑 桩 可 能 失败 的 情况 。 一 个 地 点 的 系统 失败 不 经 党 
出 现 , 但 通常 会 出 现 崩溃 的 情况 。 当 系统 崩溃 时 ， 主 存 (不 是 大 容量 的 存储 设备 ) 中 的 内 容 
丢失 ， 系 统 必须 重启 。 在 恢复 时 ， 通 常 不 去 恢复 系统 在 崩溃 时 正在 处 理 的 过 程 。 

分 布 式 系统 的 失败 不 仅 包括 特定 计算 机 的 崩溃 ， 而 且 包 括 通信 的 失败 。 相 比较 而 言 ， 这 
样 的 失败 可 能 是 持久 的 (通信 线路 的 长 期 故障 )， 也 有 可 能 是 暂时 的 (一 个 消息 丢失 ， 而 后 续 
消息 可 能 正确 传输 )。 系 统 中 有 成 百 上 千 或 成 千 上 万 的 计算 机 、 通 信 线 路 、 路 由 器 等 等 ， 在 任 
何 一 个 特定 的 时 间 ， 所 有 设备 都 正常 运行 的 概率 远 比 某 一 个 地 点 发 生 崩溃 的 概率 小 ， 这 就 是 
为 什么 在 分 布 式 系统 中 经 常 出 现 故 障 的 原因 。 

不 可 能 所 有 的 部 分 都 出 现 故障 ， 系 统 的 大 部 分 仍 会 正常 工作 ， 应 用 可 能 要 求 在 某 些 组 件 
出 现 故障 时 仍然 可 用 。 与 单个 地 点 的 系统 相 比 ， 在 分 布 式 系统 中 ， 如 果 一 个 故障 干扰 到 客户 
机 与 服务 器 的 交互 ， 但 它 还 有 可 能 继续 提供 服务 。 例 如 ， 在 向 服务 器 桩 发 送 服务 器 调用 参数 
后 ， 客 户 机 桩 必须 等 待 一 个 应 答 消息 。 如 果 在 规定 的 时 间 里 没有 收 到 应 答 消息 ， 就 可 能 出 现 
,了 如 下 情况 : 

“来 自 客 户 机 的 调用 消息 还 在 传输 过 程 中 。 

“来 自 客户 机 的 调用 信息 丢失 。 

。 服务器 崩溃 。 

“服务 器 已 开始 服务 ， 但 还 没有 完成 。 

“服务 器 已 经 完成 服务 ， 但 来 自 服务 器 的 应 答 消息 还 在 传输 过 程 中 。 

“服务 器 已 经 完成 服务 ， 但 来 自 服务 器 来 的 应 答 消息 丢失 。 

基于 以 上 情况 ， 客 户 端的 桩 程序 采取 以 下 措施 中 的 一 种 : 

* 继续 等 待 。 

“发 送 另 一 个 调用 消息 给 服务 器 。 

“发 送 一 个 调用 消息 给 处 在 不 同 机 器 上 的 服务 器 ， 以 便 完成 同样 的 功能 。 

"异常 中 止 客户 机 。 

“返回 一 个 错误 指示 信息 给 客户 机 。 
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但 是 ， 客 户 机 桩 不 知道 引起 延迟 的 原因 ， 当 用 适 于 另 一 种 情形 的 应 对 措施 解决 某 个 问题 
时 ， 可 能 会 把 情况 和 弄 糟 。 例 如 ， 客户 机 可 能 会 不 明 原 因 地 等 待 ， 或 者 提前 中 止 ， 也 有 可 能 因 
应 答 消 息 丢 失 而 再 次 发 送 一 个 调用 消息 ， 这 导致 服务 器 执行 两 次 相同 的 服务 。 例 如 ， 若 客户 
机 只 是 简单 地 读 服务 器 中 的 一 些 信息 ， 上 面 所 说 的 情况 还 是 可 以 接受 的 。 而 在 另 一 些 情况 下 
却 是 不 可 接受 的 ， 例如， 客户 机 请 求购 买 机 票 。 由 于 以 上 这 些 原因 ， 处 理 失 败 的 桩 算法 可 能 
相当 复杂 。 

2. 目录 服务 

服务 器 通过 接口 知道 它 的 客户 机 。 接 口 是 公 开 的 ， 它 包含 客户 机 用 来 调用 服务 器 上 过 程 的 
必要 信息 : 过 程 名 和 参数 描述 。 正 如 我 们 在 16.4.1 和 16.6 节 所 看 到 的 ， 接 口 定 义 语 言 (Interface 
Definition Language, IDL) 是 一 种 描述 接口 的 高 级 语言 。IDL 编 译 器 将 接口 描述 信息 编译 到 一 
个 头 文件 和 特定 的 客户 机 与 服务 器 桩 程序 中 。 进 行 编译 时 ， 头 文件 包含 在 应 用 程序 中 ， 客 户 机 
桩 链接 到 结果 模块 的 客户 代码 中 。 使 用 IDL 文 件 来 描述 服务 器 接口 促进 了 开放 式 系 统 的 开发 。 
客户 机 和 服务 器 可 以 由 不 同 的 厂商 来 制造 ， 只 要 它们 在 通信 接口 上 达成 一 致 即 可 。 

但 服务 器 接口 并 不 指定 服务 器 过 程 的 Id 和 位 置 ， 服 务 器 过 程 实 际 执行 服务 器 代码 。 因 此 
在 编译 时 并 不 知道 它 的 位 置 ， 或 者 说 它 是 动态 改变 的 。 而 且 ， 服 务 器 以 具有 实例 的 类 的 形式 
实现 ， 它 们 在 网 络 上 的 不 同 节点 执行 。 因 此 ， 系 统 必须 提供 运行 机 制 来 对 客户 机 和 服务 器 进 
行动 态 绑 定 。 

绑 定 要 求 ， 一 台 服 务 器 S 在 准备 好 为 它 的 客户 提供 服务 时 ， 利 用 某 些 命名 服务 来 注册 自己 ,使 
它 对 所 有 客户 可 用 。 这 样 的 服务 通常 由 名 字 (name), AR (directory) 和 服务 器 (server) 提供 。 

为 了 注册 ，S 将 它 的 名 字 (全 局 唯一 )、 网 址 、 它 所 支持 的 接口 及 用 来 与 客户 机 交换 消息 
(用 来 实现 RPC 通 信和 的 消息 ) 的 通信 协议 提供 给 目录 服务 器 。 例 如 ，S 可 能 只 通过 TCP 连 接 来 
接受 服务 请 求 。 相 对 于 其 他 服务 器 (目录 服务 器 ) 而 言 ， 这 是 服务 器 充当 客户 机 的 例子 。 

客户 机 桩 向 目录 服务 器 提交 服务 器 的 名 字 ， 或 者 是 一 个 接口 的 4， 向 目录 服务 器 请 求 网 
络 地 址 和 通信 协议 ， 用 来 与 有 这 样 名 字 或 支持 这 种 接口 的 服务 器 通信 。 一 旦 提供 这 些 信息 ， 
客户 机 桩 就 能 与 服务 器 直接 通信 。 . 

尽管 目录 服务 器 自身 也 是 一 台 服 务 器 ， 但 它 必须 有 特定 的 状态 ， 因 为 客户 机 和 服务 器 必 
须 能 与 它 相连 ， 而 不 必 去 使 用 另外 的 目录 服务 器 (避免 出 现 先 有 鸡 与 还 是 先 有 和 蛋 的 问题 )。 因 
些 ， 它 应 位 于 一 个 众所周知 的 网 络 地 址 上 ， 不 用 使 用 目录 服务 器 就 能 确定 该 地 址 。 

目录 服务 器 可 能 是 一 个 复杂 的 实体 。 复 杂 的 一 个 原因 就 是 它 在 分 布 式 计算 中 扮演 中 心 角 
色 。 如 果 目 录 服 务 器 失败 (可 能 是 因为 它 驻 留 的 主机 崩溃 )， 客 户 机 就 不 能 定位 服务 器 ， 新 的 
分 布 式 计算 就 无 法 建立 。 为 避免 这 样 的 灾难 ， 目 录 服 务 自身 必须 是 分 布 式 的 或 者 在 网 络 上 是 
重复 存储 的 。 但 这 又 引起 新 的 问题 : 必须 确保 备份 是 最 新 的 ， 网 络 上 任意 客户 机 都 能 找到 包 
含 它 所 需 信息 的 服务 器 。 

分 布 式 计算 环境 (Distributed Computing Environment, DCE) [Rosenberry et al. 1992] 是 
一 个 中 间 件 的 例子 ， 中 间 件 支持 分 布 式 系 统 如 TP 监控 器 8 。DCE 所 提供 的 服务 是 运行 在 不 同 
操作 系统 平台 上 各 模块 之 间 的 远程 过 程 调用 。 和 其 他 基本 特征 一 样 ， 如 我 们 将 要 在 第 27 章 讨 


日 TP 监 控 器 是 基于 DCE 的 。 
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论 的 安全 服务 ， 目 录 服 务 是 在 连接 的 过 程 中 提供 的 。 
应 用 程序 事务 管理 器 (TM) 







客户 端 桩 
服务 接口 一 


资源 管理 器 8 | 


BARE ooo 
图 22-12 通过 与 事务 管理 器 通信 实现 事务 的 远程 过 程 调用 
3. 事务 管理 器 和 事务 的 RPC | 
在 实现 全 局 原子 性 时 ， 事 务 管理 器 的 角色 如 图 22-12 和 图 22-13 所 示 。 在 启动 和 中 止 事 务 的 
事务 管理 器 (TM) 内 ,X/Open 系统 调用 tx_begin()、tx_commit() 和 tx_rollback0) 来 调用 过 程 。 
当 应 用 启动 一 个 事务 T 时 ， 它 调用 tx_begin()。 如 图 22-12 所 示 ，TM 返 回 一 个 事务 标识 符 tid， 
它 唯一 地 标识 T。 事 务 标识 符 保留 在 客户 机 的 桩 数据 空间 里 。 


应 用 程序 





事务 管理 器 (TM) 










,资源 管理 器 Ss。 | 


prem 7 体 
图 22-13 与 事务 管理 器 通信 来 实现 原子 提交 协议 
随后 ， 一 旦 有 客户 机 调用 资源 管理 器 S$， 客户 机 桩 就 把 id 附加 到 调用 消息 中 ， 供 S 来 识别 
调用 的 事务 。 如 果 这 是 T 向 S 发 出 的 第 一 个 请 求 ， 服 务 器 桩 就 通知 TM， 现 在 通过 调用 TM 的 过 
程 xa_reg() 并 传递 tid 为 T 提 供 服 务 。 因 此 ，TM 能 记录 所 有 参与 T 服 务 的 资源 管理 器 标识 ，S 称 
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作 T 的 一 个 队 〈cohort)。xa_reg(0 是 X/Open 的 ， 处 在 事务 管理 器 和 资源 管理 器 之 间 的 xa 接 口 的 
一 部 分 。 当 事务 管理 器 和 资源 管理 器 都 支持 xa 接 口 时 ， 它 们 能 共同 支持 分 布 式 事务 ;即使 它 
们 是 不 同 厂 商 的 产品 。 | 

注意 ， 定 义 tx 接口 和 xa 接 口 的 标准 ，tx 接 口 是 应 用 和 事务 管理 器 之 间 的 接口 ，xa 接 口 是 事 
务 管理 器 和 资源 管理 器 间 的 接口 ， 该 标准 没有 定义 应 用 和 资源 管理 器 之 间 的 接口 ， 这 样 的 接 
口 是 由 资源 管理 器 自身 来 定义 的 。 

因为 过 程 调用 是 一 种 同步 通信 机 制 〈 调 用 者 一 直 等 到 被 调用 者 执行 完毕 为 止 ) ， 当 子 事务 
完成 计算 时 ， 它 所 调用 的 所 有 子 事务 也 执行 完毕 。 因 此 ， 当 事务 树 的 根 完成 计算 时 ， 整 个 分 
布 式 事务 也 执行 完毕 。 根 可 以 要 求 ， 事 务 通过 调用 事务 管理 过 程 tx_comit() 来 提交 ， 如 图 
22-13 所 示 (如 果 客 户 机 希望 异常 中 止 事务 T， 它 就 调用 tx_rollback())。 事 务 管理 器 必须 确保 
事务 的 终止 是 全 局 原子 性 的 ， 即 被 事务 T 调 用 的 所 有 服务 器 要 么 全 部 提交 要 么 全 部 异常 中 止 。 
事务 管理 器 是 通过 参与 原子 提交 协议 来 实现 上 述 要 求 的 ， 它 在 其 中 充当 协调 员 ， 而 资源 管理 
器 作为 支持 者 。 被 广泛 使 用 的 原子 提交 协议 是 两 段 提 交 协 议 ， 该 协议 将 在 26.2 节 描述 。 

为 执行 提交 协议 ， 事 务 管 理 器 必须 与 所 有 的 参与 者 (AS) 通信 ， 如 图 22-13 所 示 。 这 是 
通过 使 用 资源 管理 器 所 登记 的 回执 来 实现 的 。 除 资源 管理 器 提供 给 应 用 的 标准 服务 接口 外 ， 
它 还 给 事务 管理 器 提供 一 组 回调 (callback )， 它 们 是 资源 管理 器 的 过 程 ， 可 被 事务 管理 器 用 
于 不 同 的 目的 。 每 个 资源 管理 器 提供 不 同 的 回调 ， 这 取决 于 它 所 能 提供 的 服务 。 为 此 ， 那 些 
参与 原子 提交 协议 的 事务 管理 器 就 注册 回调 9 。 如 果 支 持 者 不 注册 这 样 的 回调 ， 就 不 能 参与 
协议 ， 全 局 原子 性 也 就 不 能 得 到 保证 。 

因此 ， 我 们 刚才 所 讨论 的 过 程 调用 机 制 (涉及 使 用 tid 和 xa 接 口 ) 是 RPC 机 制 的 一 个 升级 ， 
是 用 来 实现 全 局 原子 性 的 一 个 组 成 部 分 。 它 由 TP 管理 器 来 提供 ， 称 作 事务 远程 过 程 调用 
(Transactional Remote Procedure Call, TRPC) ©, 

全 局 原子 性 由 桩 和 事务 管理 器 实现 。 它 涉及 以 下 方面 : 

。T 启 动 时 ， 由 事务 管理 器 为 事务 T 建 立 一 个 标识 。 

*T 的 标识 作为 参数 包含 在 过 程 调用 消息 中 。 

。 只 要 调用 新 的 资源 管理 器 ， 就 通知 事务 管理 器 。 

“事务 完成 时 执行 原子 提交 协议 (参见 26.2 节 ) 。 

为 获得 全 局 原子 性 (必须 由 TRPC 来 处 理 )， 必 须 克服 由 网 络 中 的 失败 引起 的 另 一 个 障碍 。 
在 22.4.1 节 ， 我们 看 到 一 些 失 败 的 情形 ， 这 些 失 败 阻止 客户 桩 接收 它 向 服务 器 S 所 发 出 请 求 消 息 
的 应 答 消息 ， 但 客户 桩 是 无 法 区 分 这 些 失 败 的 。 桩 所 采取 的 动作 会 产生 不 同 的 结果 。 特 别 是 当 
调用 消息 被 重 发 时 ， 服 务 将 被 执行 两 次 ， 即 使 调用 消息 没有 重 发 ， 桩 也 不 能 认为 服务 没有 完成 。 

在 这 种 情况 下 ， 桩 的 动作 必须 确保 被 请 求 的 服务 在 S 上 执行 一 次 ， 人 允许 事务 继续 ， 或 确保 
所 请 求 的 服务 根本 没有 做 (假设 其 他 服务 器 不 能 提供 这 样 的 服务 ) ， 事 务 被 异常 中 止 。 因 此 ， 
桩 必须 确信 什么 叫 精确 执行 一 次 的 语义 。 

在 执行 所 请 求 的 服务 时 ，S 可 能 要 调用 其 他 服务 器 S'， 这 种 情况 就 会 更 加 复杂 。 如 果 S 所 
在 的 计算 机 发 生 崩 溃 ，S' 在 网 络 的 其 他 地 方 执行 ， 这 就 出 现 一 个 孤儿 (orphan)， 即 $' 没 有 报 

日 、 支 持 分 布 式 存储 点 的 回调 为 另 一 个 实例 。 

@@“TRPC 以 有 效 RPC 增 强 形式 的 执行 将 在 27.6 节 讨论 。 
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告 它 执行 结果 的 父 进程 ( 即 S)。 在 这 种 情况 下 ， 桩 的 工作 就 非常 重要 ， 必 须 保 证 精确 执行 一 
次 的 语义 。 

4. 多 个 域 的 分 布 式 事务 

这 里 ， 我 们 假设 整个 分 布 式 事务 的 提交 协议 是 由 事务 管理 器 来 控制 的 。 事 实 上 ， 事 务 管 
理 器 的 职责 仅 局 限于 一 个 域 (domain) ， 这 个 域 通常 包含 事务 管理 器 执行 的 地 点 的 所 有 资源 管 
理 器 (尽管 可 能 还 有 其 他 的 组 织 ) 。 

假设 域 D。 的 分 布 式 事务 的 一 个 成 员 (可 能 是 应 用 模块 ， 也 可 能 是 资源 管理 器 ) 是 由 事务 
管理 器 TM 控制 的 ， 该 成 员 调 用 域 De 的 资源 管理 器 Rae，Rs 是 由 事务 管理 器 了 TMs 控制 的 。 以 后 ， 
TMs 将 作为 Rs 及 所 有 在 Ds 与 Re 相关 事务 的 协调 员 来 参加 原子 提交 协议 。 对 TM 而 言 ，TMs 是 
作为 所 有 这 些 事务 的 代表 ， 也 是 TMA 的 支持 者 。 因 此 ，TMA 必 须 被 告知 ，TMs 是 它 的 一 个 组 
成 成 员 。 对 Rs 和 TMA 而 言 ，TMs 也 必须 知道 它 的 这 种 双重 角色 。 在 分 布 式 事务 的 X/Open 模 型 
中 ， 由 一 个 称 为 通信 资源 管理 器 (communication resource manager) 的 服务 器 来 负责 传播 这 
类 信息 。 域 中 事务 管理 器 和 通信 资源 管理 器 之 间 的 接口 称 作 xa+ 接 口 。 

因此 ， 分 布 式 事务 的 结构 就 像 一 棵 树 ， 如 图 22-14 所 示 。 资 源 管 理 器 作为 叶子 节点 ， 事 务 
管理 器 作为 内 节点 〈 注 意 ， 应 用 模块 不 是 树 的 一 部 分 ， 因 为 只 有 资源 管理 器 需要 参与 原子 提 
交 协 议 ， 以 确定 是 否 提交 对 它 所 管理 的 资源 的 修改 ， 这 些 资源 是 由 它们 来 管理 的 )。 树 的 根 是 
事务 管理 器 ， 它 控制 分 布 式 事务 启动 的 域 。 设 置 事务 边界 的 应 用 程序 发 送 提交 请 求 给 事务 管 
理 器 ， 由 事务 管理 器 执行 协议 。 图 中 显示 仅 有 两 个 分 支 的 树 。 一 般 来 说 ， 分 布 式 事务 树 的 分 
支 数 是 任意 的 。 沿 着 树 边缘 的 实际 消息 交换 在 26.2.1 节 描述 。 


IRD, 





图 22-14 分 布 式 事务 的 树 结构 


22.4.2 对 等 通信 


在 远程 过 程 调用 中 ， 客 户 机 通过 发 送 请 求 消息 给 服务 器 来 激活 一 个 过 程 ， 然 后 等 待 应 答 ， 
因此 通信 是 同步 的 。 子 事务 在 服务 器 上 执行 ， 当 服务 完成 后 ， 就 发 送 一 个 应 答 消 息 。 这 种 请 
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求 /应 答 的 通信 模式 是 不 对 称 的 ， 客 户 机 和 服务 器 不 是 并 发 执行 的 。 

相反 ， 对 等 通信 (peer-to-peer communication) 是 对 称 的 : 一 旦 建立 连接 ， 双 方 使 用 名 字 
发 送 和 接收 命令 。 这 种 方式 会 更 加 灵活 ， 因 为 通信 双方 支持 各 种 消息 模式 。 发 送 是 异步 操作 ， 
这 意味 着 系统 要 对 所 发 消息 进行 缓冲 ， 然 后 把 控制 权 交 给 发 送 者 。 和 和 RPC 不同， 发 送 方 和 接 
收 方 能 并 发 执行 。 发 送 方 可 能 要 完成 一 些 计 算 ， 或 者 发 送 额外 的 信息 ， 因 此 在 接收 方 应 答 之 
前 ， 一 个 消息 流 可 能 从 发 送 方 流 到 接收 方 。 和 RPC 一 样 ， 对 等 通信 是 由 低级 消息 传输 协议 
(如 TCP/IP 或 者 SNA) 支持 的 。 

同样 ， 灵 活性 是 以 增加 复杂 性 为 代价 的 。 通 信 双 方 都 必须 能 够 处 理 对 方 使 用 的 消息 模式 ， 
这 意味 着 有 更 多 出 错 的 可 能 。 例 如 ， 每 一 个 进程 在 继续 执行 之 前 ， 期 望 从 另 一 个 进程 得 到 消 
息 ， 这 就 会 导致 死 锁 发 生 。TP 监 控 器 支持 对 等 通信 不 仅 是 因为 它 的 灵活 性 更 高 ， 而 是 因为 许 
多 数据 库 服 务 器 (经常 运 行 在 主机 上 ) 都 使 用 这 种 通信 模式 。 

1. 建立 连接 

目前 有 多 种 对 等 通信 协议 。 我 们 在 这 一 节 的 讨论 基于 IBM 常 用 的 SNA 协 议 LU6.2[IBM 
1991] 和 与 它 接口 的 API。 

在 开始 对 话 之 前 ， 模 块 必须 和 它 所 要 通信 的 程序 建立 连接 。 这 是 通过 一 个 以 目标 程序 名 
字 作 为 参数 的 allocateO) 命 令 来 完成 的 。 通 过 创建 一 个 新 的 程序 实例 来 结束 对 话 。 和 RPC 相 反 ， 
位 置 透明 性 不 是 它 的 目标 ， 请 求 通信 方 会 明确 提供 接收 程序 的 地 址 。 

我 们 再 回 到 22.4 节 分 布 式 计算 的 例子 ，A: 可 能 与 A: 建 立 对 等 通信 连接 。 启 动 新 的 缴费 程 
序 的 实例 来 接收 由 A, 发 来 的 消息 。 

在 LU6.2 中 的 连接 是 半 双 工 的 , 连接 通常 是 半 双 工 或 是 全 双 工 。 利用 半 双 工 (half duplex), 
消息 只 能 从 通信 双方 的 一 方 流 到 另 一 方 ， 在 任意 给 定 的 时 间 里 ， 模 块 A 是 发 送 方 (当前 连接 对 
A 来 说 是 发 送 模 式 )， 另 一 个 模块 B 是 接收 方 ( 对 B 来 说 是 接收 模式 )。A 发 送 任意 多 的 消息 给 B， 
然后 传递 发 送 许可 给 B。 这 时 ，B 为 发 送 方 而 A 为 接收 方 。 当 B 完 成 消息 发 送 后 ， 它 又 把 发 送 许 
可 权 返 回 给 A， 这 样 的 过 程 重复 继续 下 去 。 这 是 和 一 个 全 双 工 (full duplex) 连接 相反 的 。 在 
全 双 工 通信 中 ， 任 意 时 间 里 双方 都 能 发 送 。 在 半 双 工 通信 中 ， 当 前 连接 的 方向 只 是 它 的 上 下 
文 的 一 部 分 。 . 

当 模 块 A 中 的 例 程 作为 事务 的 一 部 分 执行 时 ， 它 与 模块 B 中 的 一 个 程序 实例 建立 连接 ， 事 
务 从 A 传播 到 B。 一 旦 连接 建立 ，A 与 B 是 对 等 的 双方 ， TMERRALERE ioe 
务 。 客 户 机 /服务 器 用 来 通过 连接 通信 的 上 下 文 信 电 可 以 方便 地 保存 在 局 部 变量 中 ， 因此 ， 

个 到 来 的 消息 就 能 按照 它 的 上 下 文 信息 进行 解 
释 。 因 此 ， 使 用 对 等 交互 的 协议 经 常 是 有 状态 
BY (stateful). 

参与 任意 多 个 不 同 的 对 等 连接 的 模块 是 并 
发 的 。 因 为 事务 中 的 任意 一 个 模块 都 能 与 另 一 
个 模块 建立 新 的 连接 ， 分 布 式 事务 的 常见 结构 
是 典型 的 非 循 环 图 。 如 图 22-15 所 示 ， 其 中 节 
点 代表 参与 通信 的 事务 ， 边 代表 连接 。 图 是 非 
循环 的 ， 因 为 当 建立 连接 时 ， 就 创建 一 个 新 的 图 22-15 通过 对 等 连接 通信 的 模块 集 
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程序 实例 。 因 此 ， 图 中 的 节点 代表 实例 ， 为 一 个 程序 和 已 有 的 实例 建立 一 个 连接 是 不 可 能 的 。 
如 图 中 的 C 和 DD， 它们 代表 同一 程序 的 两 个 不 同 实 例 。 图 中 没有 哪个 节点 的 作用 类 似 于 一 个 过 
程 调 用 层次 的 根 节点 。 

2. 分 布 式 提交 

由 于 使 用 对 等 连接 ， 竹 交 的 规则 是 和 事务 中 参与 通信 方 地 位 平等 的 规则 一 致 的 ， 任 意 一 
个 结 点 都 能 请 求 提交 事务 。 在 分 布 式 事务 的 层次 模型 中 ， 只 有 根 模块 能 请 求 提交 ， 因 此 (Al 
为 通信 是 同步 的 ) 所 有 子 事务 在 那 一 时 刻 必 须 完成 。 与 之 相反 ， 对 等 事务 不 是 同步 的 ， 当 其 
中 一 个 事务 决定 提交 时 ， 与 它 对 等 的 事务 可 能 还 在 执行 ， 并 不 一 定 准备 提交 。 因 此 ， 作 为 整 
体 来 提交 的 事务 确保 所 有 的 参与 者 都 已 执行 完毕 。 这 样 ， 系 统 执行 一 个 原子 提交 协议 ， 它 保 
证 所 有 参与 者 要 么 全 部 提交 ， 要 么 中 止 。 以 下 的 描述 是 基于 [Maslak et al. 1991] 的 。 

在 一 个 组 织 合理 的 事务 中 ， 一 个 模块 A 开始 提交 。 此 时 A 的 所 有 连接 都 必须 处 在 发 送 模式 。 
A 通过 声明 一 个 同步 点 (syncpoint) 来 开始 提交 ， 这 使 得 一 个 同步 点 消息 (syncpoint message ) 
发 送 给 A 的 所 有 连接 ， 然 后 A 等 待 ， 直 到 提交 协议 完成 为 止 。 

当 收 到 同步 点 消息 时 ， 连 接 到 A 的 B 可 能 还 没有 完成 它 的 那 部 分 事务 。 当 B 执 行 完 成 后 ， 它 
的 所 有 连接 ( 除 与 A 的 连接 外 ) 都 处 在 发 送 模式 ， 它 也 定义 一 个 同步 点 ， 发 送 给 它 的 所 有 连接 
( 除 与 A 的 连接 外 )。 这 样 ， 同 步 点 消息 传 遍 整个 事务 图 。 通 过 它 仅 有 的 一 个 连接 (如 图 中 的 E) 收 
到 一 个 同步 点 消息 的 节点 也 可 以 定义 一 个 同步 点 ， 但 没有 额外 的 同步 点 消息 。 最 终 ， 所 有 的 对 
等 方 都 定义 一 个 同步 点 ， 通 过 它们 的 同步 点 定义 实现 同步 ， 现 在 可 以 实施 原子 提交 协议 。 

同步 点 协议 要 求 只 有 一 个 模块 启动 它 ， 只 有 当 它 所 有 的 连接 都 处 在 发 送 模式 ， 并 且 没有 
收 到 任何 同步 点 消息 ， 或 者 除 一 个 连接 之 外 ， 所 有 与 它 的 连接 都 处 在 发 送 模式 状态 ， 它 处 在 
接收 模式 状态 ， 通 过 连接 收 到 一 个 同步 点 消息 ， 一 个 模块 才能 定义 一 个 同步 点 。 如 果 协 议 不 
能 正确 执行 ， 事 务 就 异常 中 止 。 例 如 ， 如 果 两 个 参与 方 都 通过 定义 一 个 同步 点 来 启动 协议 ， 
通过 连接 ， 同 步 点 消息 会 在 某 些 中 间 节 点 会 罕 ， 这 违反 协议 ， 导 致 事务 异常 中 止 。 

全 局 原子 性 可 以 通过 使 用 类 似 于 事务 管理 器 的 模块 来 实现 ， 这 种 模块 称 为 同步 点 管理 器 
(syncpoint manager)。 当 一 个 程序 接受 对 等 连接 时 ， 同 步 点 管理 器 与 程序 A 的 新 实例 相关 联 。 
同步 点 管理 器 还 有 相关 的 域 。 这 和 RPC 使 用 的 技术 相 类 似 ， 每 当 A 首 次 调用 域 中 的 一 个 资源 管 
理 器 时 ，A 的 同步 点 管理 器 就 被 告知 事务 中 加 入 新 成 员 。 类 似 地 ， 如 果 A 与 B 建 立 一 个 连接 ， 
A 的 同步 点 管理 器 就 被 告知 ，B 的 同步 点 管理 器 加 入 到 事务 中 。 同 步 点 管理 器 必须 对 域 中 事务 
的 所 有 参与 者 的 原子 提交 协议 进行 管理 (这 里 ，A 是 作为 参与 者 )， 这 和 图 22-14 中 所 表示 的 一 
样 。 树 的 根 是 参与 者 的 同步 点 管理 器 ， 初 始 同步 点 是 由 该 参与 者 来 定义 的 。 

当 同 步 消息 到 达 一 个 叶子 节点 时 ， 著 处 在 该 叶子 节点 的 子 事务 已 经 执行 完 ， 一 个 应 答 消 
息 就 返回 给 树 的 根 节 点 。 当 所 有 叶子 节点 都 回复 后 ， 根 节点 就 认为 整个 事务 已 经 执行 完毕 。 
这 个 协议 的 详细 描述 在 26.2.4 节 给 出 。 


22.4.3 事务 中 异常 情况 的 处 理 


当 模 块 使 用 RPC 通 信 时 ， 被 调用 者 (或 服务 器 ) 组 织 起 来 接收 服务 请 求 。 它 导出 一 个 过 
程 用 于 对 请 求 进行 服务 。 当 没有 请 求 时 ， 服 务 器 空闲 ， 等 待 下 一 个 请 求 。 这 和 对 等 通信 有 点 
类 似 。 在 这 种 情况 下 ， 服 务 器 接收 一 个 连接 ， 执 行 一 个 接收 命令 。 当 没有 服务 请 求 时 ， 服 务 
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在 设计 为 另 一 模块 的 请 求 服务 的 模块 时 ， 过 程 通信 和 对 等 通信 都 是 有 用 的 。 但 在 模块 还 
必须 处 理 异 常情 况 时 ， 这 些 通 信 模 式 通 常 是 不 合适 的 ， 因 为 模块 不 能 只 是 等 待 请 求 的 发 生 ， 
它 还 必须 执行 其 他 任务 。 

例如 ， 假 设 模块 Mi 重复 地 读 取 和 记录 一 个 炉子 的 温度 。 模 块 M; 对 炉子 的 使 用 过 程 进行 控 
制 〈 可 能 在 另 一 台 计 算 机 上 执行 )， 当 温度 达到 某 特殊 的 限定 值 时 ，M: 就 被 告知 这 一 异常 情况 
(可 能 M: 将 炉子 关 掉 )。 因 为 M: 是 作为 控制 者 ， 它 需要 一 种 方法 来 确定 何 时 发 生 异 常情 况 。 实 
现 这 种 要 求 的 一 种 办 法 就 是 ，M2 定 期 使 用 过 程 化 通信 访问 Mi ， 要 求 返回 当前 的 温度 记录 。 对 
M: 来 说 ， 另 一 种 方法 就 是 建立 一 个 对 等 连接 ， 定 期 向 Mi 发 送 温度 请 求 消 息 。 这 些 方法 称 为 轮 
询 法 (polling )。 如 果 值 不 可 能 达到 限定 值 ， 那 么 使 用 轮 询 法 是 一 种 资源 的 浪费 ， 因 为 M; 不 停 
”地 发 送 请 求 ， 但 应 答 却 指示 不 用 采取 任何 措施 。 而 当 温 度 达到 这 一 极限 值 时 ，M: 必 须 快 速 反 
应 ， 轮 询 法 就 显得 更 加 浪费 ， 因 为 这 时 需要 更 加 频繁 的 通信 。 

作为 第 二 个 例子 ， 考 虑 一 个 POS 机 系统 ， 其 中 应 用 模块 M 在 销售 终端 上 ， 由 它 来 对 客户 从 
键盘 上 输入 的 服务 请 求 做 出 响应 。 如 果 系 统 准 备 暂 时 离线 ， 那 么 不 能 服务 的 消息 必须 在 终端 
显示 出 来 。 但 如 果 M 只 对 键盘 上 的 输入 做 出 反应 ， 而 不 能 识别 来 自 中 心 站 点 的 通信 信息 ， 它 
就 不 会 被 通知 打印 离线 的 消息 。 可 见 ， 对 异常 情况 做 出 响应 的 机 制 是 必需 的 。 

在 以 上 的 例子 中 ， 使 用 标准 的 客户 机 /服务 器 范式 来 设计 M， 使 之 对 来 自 中 心地 点 的 请 求 
(还 有 来 自 键盘 的 请 求 ) 做 出 反应 是 可 能 的 。 但 如 果 要 求 对 中 心地 点 做 出 响应 是 受 时 间 限 制 的 ， 
那么 仅 用 这 种 方式 可 能 还 不 够 充分 。 如 果 要 求 的 响应 时 间 比 分 配给 键盘 请 求 服务 的 时 间 还 少 ， 
那么 采用 中 断 机 制 是 必要 的 。 

异常 情况 称 作 事件 (event)。 一 些 TP 监 控 器 提供 事件 通信 (event communication) 机 制 ， 
利用 它 模 块 就 能 识别 事件 ， 并 能 方便 地 通知 另 一 个 模块 M 对 事件 进行 处 理 。 通 知 可 能 采用 中 
断 的 形式 ， 促 使 M 执 行事 件 处 理 例 程 9 。 如 果 事 件 识别 发 生 在 一 个 事务 的 上 下 文中 ， 事 件 处 理 
器 的 执行 就 变 成 事务 的 一 部 分 。 这 样 ， 事 件 处 理 ( 像 RPC 和 对 等 通信 一 样 ) 使 得 一 个 分 布 式 
事务 从 一 个 模块 扩展 到 另 一 个 模块 。 

可 以 中 断 的 模块 使 用 TP 监控 器 的 事件 处 理 API 函 数 来 注册 事件 处 理 器 (event handler) 
(或 回调 )， 在 通知 事件 发 生 时 就 开始 执行 事件 处 理 器 。 如 图 22-16 所 示 ，、，M 使 用 TP 监控 器 注册 
事件 处 理 器 foo。 因 为 M 不 等 待 事件 的 发 生 ， 而 是 继续 进行 它 的 正常 工作 ， 所 以 事件 通知 被 称 
为 是 主动 提供 的 (unsolicited )。 

当 要 处 理 的 事件 发 生 时 ， 系 统 打 断 M 的 执行 。 它 保存 M 的 当前 状态 ， 并 将 控制 传递 给 foo。 
. 当 foo 退 出 时 ， 系 统 利用 已 保存 的 状态 将 控制 返回 M 被 中 断 的 点 。 当 事件 发 生 时 ，M 可 以 立即 
响应 。 响 应 是 异步 的 ， 因 为 无 法 事先 确定 事件 何 时 发 生 ， 也 不 能 确定 在 M 执 行 ( 即 两 个 指令 
之 间 ) 的 哪个 时 间 点 foo 会 执行 。 虽 然 快速 响应 非常 重要 ， 但 需要 仔细 设计 ， 以 确保 处 理 器 的 
执行 不 会 干扰 中 断 的 计算 。 

如 图 22-16 所 描述 的 那样 ， 事 件 生成 模块 N 使 用 事件 API 来 指示 系统 ， 事 件 已 经 发 生 ， 模 块 

O M 可 能 选择 延迟 执行 程序 处 理事 件 ， 直 到 它 明确 通知 TP 监 控 器 ， 它 已 准备 就 绪 ， 能 处 理 任何 发 送 给 它 的 事 


件 为 止 。 
O ”我 们 的 讨论 基于 Tuxedo 事 务 处 理 系统 中 的 事件 通信 [Andrade et al. 1996]。 
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M 被 中 断 。 这 个 过 程 常 被 称 作 通 知 ( notication)。 假 设 M 已 经 注册 事件 处 理 器 ，TP 监 控 器 促使 
它 执 行 这 个 事件 处 理 器 。API 人 允许 事件 生成 模块 将 消息 作为 一 个 参数 传 给 它 。 


模块 N (温度 传 感 ) ， ， 


i 
| 
A aa a ae Al 








模块 M (火炉 控制 ) 


模块/ 事件 处 理 器 关联 表 一 
图 22-16 将 一 个 事件 生成 模块 与 一 个 事件 处 理 模块 相 链 接 的 事件 处 理 过 程 


这 种 简单 的 事件 通信 形式 是 有 用 的 ， 但 它 有 一 个 重要 的 缺点 ， 事件 生成 模块 必须 知道 被 
通知 模块 的 ID ( 可 能 不 止 一 个 模块 )。 应 用 中 对 事件 做 出 响应 的 模块 可 能 会 变化 ， 让 目标 事件 
处 理 模块 对 事件 生成 模块 而 言 是 透明 的 ， 因 而 是 值得 的 ， 这 可 以 通过 使 用 事件 代理 来 做 到 。 

事件 代理 (event broker) 是 TP 监 控 器 提供 的 服务 器 。 它 是 连接 事件 生成 模块 和 事件 处 理 
模块 的 桥梁 。 使 用 事件 代理 时 ， 给 每 个 事件 起 一 个 名 字 。 事 件 处 理 模块 M 在 用 TP 监 控 器 注册 
事件 处 理 例 程 后 ， 它 通过 使 用 事件 API， 调 用 事件 代理 来 订阅 (subscribe) 事件 E。 事件 的 名 
字 是 作为 参数 来 提供 的 。 代 理 记 录 已 命名 事件 和 M 之 间 的 关联 。 一 个 事件 可 能 有 多 个 订阅 方 ， 
这 种 情况 下 ， 它 就 与 一 个 事件 处 理 模块 列表 相关 联 。 当 事件 发 生 时 ,事件 生成 模块 N 就 将 事件 
发 送 给 代理 (再 次 使 用 代理 的 API， 把 事件 的 名 字 作为 参数 来 传递 )。 然后 代理 通知 所 有 事先 
订阅 事件 的 模块 。 这 种 情况 如 图 22-17 所 示 ， 尽 管 这 幅 图 看 起 来 和 图 22-16 有 点 相似 ， 但 要 注 
意 ， 代 理 保留 已 命名 事件 和 事件 处 理 模块 之 间 的 关联 ， 并 使 用 通知 来 与 事件 处 理 模块 通信 。 
正如 前 面 所 述 ， 事 件 处 理 模块 和 事件 处 理 例 程 的 关联 保存 在 TP 监 控 器 中 。 

和 其 他 形式 的 通信 一 样 ， 通过 事件 通信 可 使 事务 从 一 个 模块 扩展 到 另 一 个 模块 。 例 如 ， 
在 事件 生成 模块 中 ， 如 果 post (Event) 动作 是 作为 事务 的 一 部 分 来 完成 的 ， 结果 处 理 器 的 执 
行 也 可 作为 那个 事务 的 一 部 分 。 但 在 有 些 情况 下 ， 处 理 器 的 执行 不 应 作为 那个 发 送 事件 事务 
的 一 部 分 。 例 如 ， 执行 数据 库 操作 的 事务 可 能 发 现 一 个 不 可 修正 的 数据 库 错误 ， 它 请 求 异常 
中 止 。 在 异常 中 止 之 前 ， 事 务 可 能 想 发 送 一 个 事件 ， 把 这 个 错误 通知 给 数据 库 管 理 员 。 此 时 ， 
事件 处 理 器 不 应 该 是 事务 的 一 部 分 ， 否 则 ， 在 事务 异常 中 止 的 时 候 ， 它 也 被 异常 中 止 ， 数 据 
库 管 理 员 就 不 会 得 到 通知 。 控制 事务 何 时 扩展 为 一 个 事件 发 送 结果 的 规则 ， 是 事务 处 理 系统 
协议 实现 的 一 部 分 。 


22.5 因特网 上 的 事务 处 理 
因特网 的 增长 促进 了 许多 异 构 分 布 式 事务 处 理应 用 的 发 展 。 这 些 应 用 使 用 已 存在 的 客户 
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软件 (Web 浏览 器 ) 和 标准 的 因特网 通信 协议 与 Web 服 务 器 通信 ，Web 服 务 器 提供 事务 处 理 的 
功能 。 一 个 Web 服 务 器 有 因特网 地 址 ( 即 ， 它 在 因特网 上 是 可 访问 的 )， 对 使 用 标准 因特网 协 
议 ( 例 如 HTTP、SMTP 或 FTP) 的 Web 提 供 访 问 服务 。 


”事件 处 理 器 模块 N (温度 传 感 ) 
t 






ae asl Post(E) 


事件 名 字 / 模 块 关联 表 


os ee? 
[E:M d iy 
a | l 


rd 


执行 foo0 





“TPKE 


模块 /事件 处 理 器 关联 表 一 


图 22-17 使 用 事件 代理 来 处 理事 件 传 递 


利用 这 样 的 系统 ， 通 过 Web 服 务 器 ， 一 个 用 户 可 以 启动 事务 来 访问 全 世界 的 数据 库 ， 把 
它 的 浏览 器 作为 表示 服务 器 。 对 各 种 多 媒体 ， 只 要 点 击 鼠 标 就 可 访问 ， 再 点 击 几 下 鼠标 就 能 
找到 提供 某 件 商品 的 最 便宜 的 厂商 ， 再 点 击 几 下 鼠标 就 能 将 商品 买 下 来 ， 所 有 这 些 都 是 用 户 
在 家 中 完成 的 。 

另外 ， 很 多 企业 都 使 用 因特网 技术 来 构建 企业 内 部 网 和 企业 外 部 网 。 

“企业 内 部 网 “企业 内 部 网 是 通过 专用 网 络 将 企业 内 部 各 个 站 点 互 连 而 得 到 的 ， 它 脱离 了 

因特网 ， 但 使 用 的 是 因特网 技术 ， 企 业 通过 内 部 网 来 开展 企业 业务 。 在 加 利 福 尼 亚 见 到 

的 一 个 产品 ， 可 能 是 在 纽约 设计 的 ， 在 香港 制造 的 ， 在 芝加哥 上 市 ， 在 新 泽 西 集中 进行 

账户 结算 。 

“企业 外 部 网 ”企业 厂商 和 业务 客户 使 用 它们 的 企业 外 部 网 进行 连接 。 为 满足 位 于 得 梅内 

的 企业 部 门 的 要 求 ， 全 世界 的 办 公用 品 厂商 都 能 来 竞标 。 

对 网 络 上 的 商务 活动 而 言 ， 事 务 起 着 关键 作用 。 此 时 出 现 的 一 个 重要 问题 就 是 安全 性 问 
题 ， 因 为 通过 因特网 发 送 的 信息 容易 被 截取 和 改变 ， 许 多 网 站 都 发 现 有 未 经 授权 的 用 户 间 和 人 。 
为 解决 安全 问题 ， 大 多 数 Web 浏 览 器 支持 高 级 的 基于 加 密 的 安全 协议 。 各 种 应 用 通过 使 用 防 
” 火 墙 和 类 似 机 制 来 增加 安全 性 。 我 们 将 在 第 27 章 对 因特网 事务 的 安全 问题 进行 讨论 。 


22.5.1 一 般 的 体系 结构 
在 描述 因特网 事务 处 理 之 前 ， 我 们 简短 地 介绍 普遍 使 用 的 体系 结构 ， 通 过 它 ， 信 息 在 
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Web 浏 览 器 和 Web 服 务 器 之 间 传 递 。 希 望 与 Web 服 务 器 交互 的 用 户 在 浏览 器 中 给 出 服务 器 的 地 
址 ， 这 个 地 址 以 URL (Uniform Resource Locator， 统 一 资源 定位 器 ) 的 形式 给 出 ， 例 如 ， 
http://www.somecompany.com。 浏 览 器 使 用 超 文本 传输 协议 (HyperText Transfer Protocol, 
HTTP) 与 服务 器 建立 连接 。 服 务 器 再 次 使 用 HTTP 返 回 浏览 器 要 显示 的 页 面 。 页 面 是 用 超 文 
本 标记 语言 (HyperText Markup Language, HTML) 来 书写 的 ， 它 定义 页 面 的 显示 格式 。 

服务 器 使 用 HTMEL 页 面 时 可 能 包含 一 个 或 多 个 被 称 作 appiet 的 程序 ， 它 是 用 Java 这 样 的 语 
言 来 书写 的 。applets 在 浏览 器 提供 的 程序 环境 时 执行， 它们 能 激活 HTML 页 面 ， 对 特定 的 事 
f+ (如 鼠标 单 击 ) 做 出 反应 ， 能 与 用 户 和 网 络 以 其 他 方式 交互 ， 其 中 的 一 些 方式 我 们 将 在 后 
面 进行 讨论 。 发 送 页 面 后 ， 服 务 器 与 浏览 器 断 开 连接 。 

浏览 器 收 到 页 面 后 ， 使 用 HTML 描 述 中 规定 的 页 面 格式 显示 页 面 ， 也 可 能 执行 一 些 指 定 
的 applets。 页 面 可 能 包含 按钮 、 由 用 户 填 写 的 文本 框 和 一 些 诸如 此 类 的 控件 。 用 户 与 页 的 交 
互 可 能 触发 其 他 applets 的 执行 。 与 页 面相 关联 ， 但 通常 对 用 户 来 说 是 隐藏 的 ， 这 就 是 web 服 
Se (可 能 不 是 发 送 页 面 的 那个 服务 器 ) 的 URL， 用 户 需 要 的 信息 发 送 给 该 服务 器 ， 服 务 器 
上 程序 的 名 字 被 用 来 进行 信息 处 理 。 调 用 Web 服 务 器 上 程序 的 两 个 最 流行 的 API 是 通用 网 关 接 
O (Common Gateway Interface, CGI) 和 servlets 。 

CGI 程 序 可 以 用 任意 的 语言 来 书写 ，CGI 不 是 指 编 写 程序 的 语言 ， 而 是 指 如 何 调用 程序 ， 
从 页 面 来 的 信息 是 如 何 传递 到 该 程序 。servlet 是 用 Java 编 写 的 ， 它 用 一 个 特殊 的 Java APLS A 
户 和 服务 器 上 的 其 他 程序 通信 。 除 语言 之 外 ， 这 两 个 API 的 主要 差别 是 servlet API 的 功能 更 丰 
富 。 尤 其 是 它 提供 对 会 话 管理 的 支持 ， 而 CGI 没 有 此 功能 。 浏 览 器 的 每 个 请 求 调用 一 个 CGI 程 
序 ， 而 一 个 servlet 能 处 理 来 自 同 一 个 客户 的 多 个 请 求 。 尽 管 有 这 些 差别 ， 但 这 两 个 API 还 是 很 
相似 的 ， 我 们 用 CGI 作为 例子 。 

当 用 户 点 击 “ 提 交 ” 按 钮 时 ， 浏 览 器 使 用 HTTP 与 指定 的 因特网 服务 器 建立 连接 ， 并 发 送 
消息 。CGI 程 序 在 服务 器 上 启动 ， 信 息 以 参数 的 形式 传 给 它 。 程 序 对 这 些 信 息 进行 处 理 ， 也 可 
能 执行 其 他 动作 (例如 访问 数据 库 ， 向 一 个 事务 处 理 系统 提交 请 求 )。 这 时 ， 程 序 准备 一 个 新 
的 HTML 页 面 并 将 页 面 送 回 浏览 器 。 又 一 次 ， 服 务 器 与 浏览 器 断 开 连 接 ， 并 且 不 保留 客户 的 
上 下 文 信 息 。 在 用 户 与 新 的 HTML 页 交互 后 ， 单 击 “ 提 交 ” 按 钮 ， 页 面 重 新 与 同一 个 服务 器 
或 者 不 同 的 服务 器 连接 ， 并 启动 新 的 CGI 程序 。 

”在 一 些 应 用 中 ， 浏 览 器 可 能 为 了 同一 个 用 户 与 同一 个 Web 服 务 器 重新 连接 多 次 (例如 ， 
第 一 次 从 一 个 目录 中 读 信 息 ， 然 后 定购 )。 由 于 这 个 原因 ， 服 务 器 可 能 希望 访问 这 些 交互 上 
下 文 信息 (例如 ， 描 述 用 户 的 信息 )， 因 此 ， 它 保留 与 用 户 的 会 话 信息 ， 这 个 用 户 与 它 有 过 
多 次 的 连接 。 在 其 他 一 些 应 用 中 ， 服 务 器 可 能 希望 保留 儿 天 内 的 连接 上 下 文 信息 ， 甚 至 保留 
几 周 的 信息 〈 例 如 ， 以 前 订单 中 显示 出 的 用 户 的 喜好 )。 这 些 上 下 文 信息 通常 是 不 保存 在 服 
务 器 上 的 ， 因 为 服务 器 可 能 同时 处 理 成 千 上 万 的 客户 。 在 服务 器 上 保存 所 有 客户 的 上 下 文 信 
息 是 浪费 资源 的 ， 特 别 是 一 个 浏览 器 可 能 不 回复 (或 许 用 户 无 聊 ， 把 它 的 浏览 器 指向 迪斯尼 
的 站 点 )。 在 22.2.2 节 ， 我 们 讨论 客户 机 上 存储 上 下 文 信息 的 可 能 性 。 对 浏览 器 ， 它 可 能 采取 
以 下 几 种 方式 。 . 

1) 在 一 次 会 话 内 一 一 隐藏 区 域 ” 当 发 送 一 个 HTML 页 给 浏览 器 时 ，CGI 程 序 C1 把 上 下 文 信 
息 保存 在 页 面 内 的 隐藏 区 域 (hidden field)， 这 样 的 区 域 不 在 屏幕 上 显示 ， 所 以 它 对 用 户 来 说 
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是 不 可 见 的 。 在 用 户 把 可 见 区 域 填 好 后 ， 单 击 “提交 ”按钮 ， 页 面 上 的 信息 (包括 可 见 的 和 
不 可 见 区 域 的 信息 ) 传 给 页 面 上 指定 的 CGI 程序 C2， 这 样 ，C1 知 道 的 上 下 文 信息 就 传递 给 C2。 

2) 在 一 次 会 话 内 或 会 话 之 间 一 一 cookie 一 个 用 户 浏 览 器 包含 对 应 于 服务 器 的 文件 中 
cookie 的 文件 ,这 些 服务 器 是 浏览 器 以 前 所 访问 过 的 。 每 一 个 cookie 是 一 个 上 下 文 信息 的 处 理 ， 
最 多 包含 255 个 字符 数据 ， 是 由 服务 器 创建 的 ， 对 用 户 进行 描述 ， 但 对 用 户 来 说 一 般 是 不 可 访 
问 的 。 当 浏览 器 与 一 个 服务 器 连接 时 ， 它 把 相应 的 cookie 随 用 户 输入 的 信息 传 给 服务 器 。 当 服 
务 器 应 答 时 ， 把 cookie (可 能 作 修改 ) 返回 给 浏览 器 。 

3) 使 用 servlet ”servlet 有 一 个 生命 周期 ， 存在 于 整个 客户 会 话 期 间 ， 因 此 它 包含 客户 的 上 
下 文 信息 。 另 外 ，Java servlet API 支 持 会 话 管理 ， 它 能 极 大 地 简化 服务 器 端的 处 理 。 


22.5.2 因特网 上 事务 系统 的 组 织 


对 因特网 上 的 应 用 ， 我 们 讨论 事务 处 理 系统 三 种 可 能 的 组 织 方式 。 

1) 浏览 器 作为 表示 服务 器 ， 应 用 服务 器 、 事 务 服务 器 和 数据 库 服务 器 驻 留 在 因特网 上 。 
数据 库 地 点 的 Web 服 务 器 对 来 自 浏览 器 的 请 求 做 出 响应 ， 浏 览 器 使 用 一 个 HTML 页 面 和 一 个 写 
成 Java applet 的 应 用 程序 与 用 户 交互 。 用 户 在 页 面 上 适当 的 位 置 填写 好 后 ，applet 就 在 浏览 器 
内 执行 。applet 可 能 访问 因特网 上 的 数据 库 ， 可 能 启动 一 个 事务 ， 提 交 SQL 语 句 给 数据 库 服务 
器 进行 处 理 。applet 使 用 DBC (参见 10.5 节 ) 与 数据 库 通信 。 这 个 模型 和 图 10-9 所 示 的 模型 类 
似 。JDBC 驱 动 程序 可 以 从 包含 有 Java applet 的 Web 服 务 器 上 下 载 ， 此 时 它 与 数据 库 服务 器 建 
立 一 个 网 络 连接 。 驱 动 程序 也 可 以 驻 留 在 Web 服 务 器 上 ， 通 过 CGI 程 序 把 命令 作为 传输 数据 从 
浏览 器 接收 。 | 

2) 浏览 器 作为 表示 服务 器 ，Web 服 务 器 上 的 CGI 程序 作为 应 用 服务 器 。 当 与 Web 服 务 器 
接触 时 ， 它 向 与 用 户 交 互 的 浏览 器 发 送 一 个 HTML 页 面 。 用 户 填 好 页 面 后 ， 提 交 给 服务 器 ， 
执行 企业 规则 的 CGI 程序 在 Web 服 务 器 上 启动 。 程 序 可 能 启动 包含 SQL 语句 的 事务 ， 或 者 调 
用 驻 留 在 数据 库 服务 器 上 的 存储 过 程 ， 如 图 22-4 所 示 ， 也 可 能 包含 对 事务 服务 器 的 调用 ， 
如 图 22-5 所 示 。 在 第 一 种 情形 下 ，CGI 程 序 可 能 使 用 嵌入 式 SQL 语 名 访问 数据 库 管理 系统 ， 
也 可 能 使 用 一 个 调用 接口 (如 JDBC 或 者 ODBC)。 执 行 完成 后 ， 它 返回 一 个 HTML 页 面 给 浏 
览 器 e 。 
3) 在 一 些 应 用 中 ， 一 个 三 层 事务 处 理 系统 可 能 接收 来 自 基于 因特网 或 不 基于 因特网 的 客 
户 请 求 。 不 基于 因特网 的 客户 与 应 用 服务 器 连接 ， 如 图 22-4 所 示 。 基 于 因特网 的 客户 通过 
Web 服 务 器 上 的 CGI 应 用 程序 与 应 用 服务 器 的 连接 ， 如 图 22-18 所 示 。 这 种 情况 下 ， 浏 览 器 提 
供 表示 服务 ， 但 应 用 服务 器 把 浏览 器 和 CGI 程 序 与 不 基于 因特网 的 客户 一 样 看 待 ， 只 是 作为 另 
一 个 表示 服务 器 。 对 这 样 的 系统 ，Web 服 务 器 上 的 CGI 程序 对 从 HTML 页 面 返回 的 信息 进行 处 
理 ， 使 用 应 用 服务 器 所 希望 的 通信 协议 ， 启 动 应 用 服务 器 上 相应 的 应 用 程序 。 当 应 用 程序 完 
成 后 ， 将 信息 返回 给 CGI 程序 ，CGI 难 备 相应 的 HTML 页 面 ， 然 后 将 页 面 返回 给 浏览 器 。 





O ”有 些 商 业 应 用 生成 程序 通过 生成 应 用 来 有 选择 地 支持 这 一 模型 ， 这 些 应 用 是 在 Web 服 务 器 上 执行 的 CGI 程 
序 。 应 用 设计 员 使 用 应 用 生成 程序 来 设计 显示 在 客户 端的 界面 ， 以 及 与 之 相对 应 的 信息 处 理应 用 程序 。 然 
后 ， 应 用 生成 程序 将 此 设计 转换 成 等 价 的 HTML 页 面 和 CGI 程序 。 运 行 时 ， 系 统 按 如 上 所 述 方式 执行 。 
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客户 端 计算 机 Web 服 务 器 
图 22-18 基于 因特网 的 客户 与 三 野 事务 处 理 系统 相连 接 


22.6 参考 书目 


本 章 中 的 许多 材料 来 自 两 本 书 。[Gray 1978] 是 一 本 百科 全 书 , 它 涵 盖 事 务 处 理 系统 ， 学 生 们 应 该 去 
看 这 本 非常 好 的 额外 信息 资源 。 另 一 个 非常 优秀 的 资源 是 [Bernstein and Newcomer 1997]。[Gray 1978] 
着 重 于 实现 细节 。 但 [Bernstein and Newcomer] 专 注 于 更 高 层次 的 相同 材料 。 它们 的 著作 包括 关于 两 层 和 
三 层 模 型 非常 有 用 的 讨论 ， 以 及 多 种 TP 监控 器 的 描述 。 关于 Tuxedo 的 其 他 信息 能 在 [Andrade et al. 1996] 
中 找到 。 关 于 Encina 的 内 容 能 在 [Transarc 1996] 中 找到 ，RPC 是 由 [Birrell and Nelson 1984] 介 绍 的 。 最 常 
用 的 对 等 协议 一 一 IBM 的 LU6.2 的 描述 能 在 [IBM 1991] 中 找到 。 通信 技术 的 一 般 讨 论 (包括 RPC) 能 在 
[Peterson and Davies 2000] 中 找到 。 基于 Tuxedo 系 统 中 使 用 的 模型 的 异常 情况 处 理 的 讨论 在 [Andrade et 
al. 1996] 中 有 所 介绍 。 分 布 式 事务 处 理 系统 中 X/Open 模 型 的 描述 能 在 [X/Open CAE Specification 
Structured Transaction Definition Language (STDL) 1996] 和 [X/Open Guide Distributed Transaction 
Processing: Reference Model, Version 3 1996b ] 中 找到 。 

有 很 多 著作 介绍 了 使 用 CGI 和 Java servlets 编 写 Web 应 用 程序 (包括 数据 库 应 用 )。 最 近 的 一 些 著作 
包括 [Hall 2000,Hunter and Crawford 1998 Sebesta 2001,Berg and Virginia 2000]. 


22.7 练习 


22.1 试 解释 对 银行 的 账户 数据 库 的 访问 只 通过 存储 过 程 (如 deposit0 和 withdraw()) 来 完成 的 好 处 。 

22.2 试 解释 为 什么 说 三 层 事 务 处 理 系统 (包括 事务 服务 器 ) 的 组 织 可 扩展 成 大 型 企业 系统 。 从 开销 
安全 、 维 护 、 认 证 和 授权 问题 上 加 以 讨论 。 

723 试 解释 在 三 层 体系 结构 的 事务 处 理 系统 中 ， 当 事务 正在 执行 时 ， 如 果 表 示 服 务 器 崩溃 ,会 发 生 什 
么 情况 。 

22.4 试 解释 在 ATM 机 上 ， 为 什么 按 下 submit 按 钮 之 后 ，cancel 按 钮 不 工作 。 

22.5 试 解释 在 事务 处 理 系统 的 体系 结构 中 包含 事务 服务 器 的 好 处 。 

22.6 试 举 出 一 个 你 使 用 的 事务 处 理 系统 的 例子 ， 它 是 作为 包含 集中 式 数据 库 的 分 布 式 系统 实现 的 ， 

22-7 试 举 出 一 个 分 布 式 数据 库 系统 的 例子 ， 基 中 事务 的 提交 不 满足 原子 性 ( 它 访问 的 一 个 数据 库 管理 
器 提交 而 另 一 个 异常 中 止 )， 使 数据 库 处 于 不 一 致 的 状态 。 
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22.8 试 解释 项 目 中 使 用 的 系统 是 否 可 以 描述 为 TP-Lite 或 TP-Heavy。 
22.9 列举 出 在 设计 异 构 分 布 式 事务 处 理 系统 时 会 出 现 ， 而 在 设计 同 构 分 布 式 系 统 时 不 会 出 现 的 五 个 问题 。 


22.10 
22.11 


22.12 
22.13 
22.14 


22.15 
22.16 


22.17 
22.18 
22.19 
22.20 
22.21 


22.22 
22.23 


试 解释 TP 监 控 器 与 事务 管理 器 的 区 别 。 

试 举 出 三 个 不 同 于 事务 服务 器 、 数 据 库 服务 器 、 文 件 服务 器 的 服务 器 例子 ， 该 服务 器 可 能 在 分 布 
式 事务 处 理 系 统 中 被 一 个 应 用 服务 器 调用 。 

试 摘 述 你 所 在 学 校 的 学 生 注册 系统 的 体系 结构 。 

试 给 出 两 种 方法 ， 它 们 在 事务 的 远程 过 程 调用 中 是 不 同 于 一 般 的 远程 过 程 调用 的 。 

假设 事务 使 用 TRPC 从 一 个 远程 地 点 的 数据 库 中 更 新 数据 ， 结 果 成 功 返回 。 在 事务 执行 完成 之 前 ， 
远程 地 点 崩溃 ， 当 事务 请 求 提 交 时 ， 会 发 生 什么 情况 。 

试 解释 X/Open 中 的 tx_commit() 与 马 入 在 SQL 中 的 COMMIT 语 名 的 不 同 之 处 。 

对 事务 管理 器 ， 给 出 一 个 使 用 tx 和 xa 来 实现 分 布 式 存储 点 的 建议 。 假 设 每 一 个 子 事务 (作为 一 个 
事务 的 一 部 分 ) 都 能 定义 一 个 存储 点 ， 当 它 这 样 做 时 ， 也 迫使 它 的 孩子 事务 创建 相应 的 存储 点 。 
当 一 个 事务 或 者 子 事务 回 退 到 存储 点 时 ， 它 的 孩子 事务 也 回 退 到 相应 的 存储 点 。 

在 客户 机 /服务 器 系统 中 ， 试 给 出 使 用 应 用 服务 器 体系 结构 的 三 个 好 处 。 

试 给 出 一 个 事件 的 例子 ， 它 与 书 中 给 出 的 例子 不 同 ， 例 子 中 回调 函数 不 是 事务 的 一 部 分 。 

试 解释 对 等 通信 如 何 实现 远程 过 程 调用 。 

试 解 释 使 用 信用 卡 在 因特网 上 订购 商品 时 所 涉及 的 身份 认证 问题 。 ` 
实现 一 个 Web 上 tic-tac-toe 游 戏 ， 它 的 显示 是 由 浏览 器 中 的 表示 服务 器 来 实现 的 ， 而 游戏 的 逻辑 却 
在 服务 器 中 的 CGI 程 序 中 实现 。 

打印 出 本 地 Web 浏 览 器 上 的 cookie 文 件 。 

考虑 一 个 与 集中 式 数据 库 管 理 系统 接口 的 三 层 系 统 , 其 中 ml 个 表示 服务 器 与 n2 个 应 用 服务 器 相连 ， 
n2 个 应 用 服务 器 还 与 n3 个 事务 服务 器 相连 。 假 设 对 每 个 事务 ， 应 用 服务 器 平均 调用 k 个 过 程 ， 这 
些 过 程 在 任意 一 个 事务 服务 器 中 执行 ， 同 时 每 个 过 程 平均 执行 s 条 必须 由 数据 库 管理 系统 处 理 的 
SQL 语句 。 如 果 表 示 服 务 器 平均 每 秒 处 理 r 个 请 求 ，( 每 个 请 求 在 应 用 服务 器 上 产生 一 个 事务 )， 
数据 库 管理 系统 平均 每 秒 要 处 理 多 少 条 SQL 语 句 ? 有 多 少 条 消息 要 流 经 通信 线路 ? 





第 23 章 隔离 性 的 实现 


我 们 的 学 校 有 超过 10 000 多 名 本 科 生 。 每 到 注册 时 ， 可 能 有 成 百 上 千 的 学 生 同 时 使 用 学 
生 注册 系统 。 系 统 必 须 确 保 大 量 用 户 的 并 发 使 用 不 会 破坏 数据 库 的 完整 性 。 例 如 ， 假 设 由 于 
教室 空间 所 限 ， 每 门 课程 只 允许 50 名 同学 选修 (这 是 数据 库 的 一 个 完整 性 约束 )， 而 目前 已 经 
有 49 名 同学 选修 这 门 课程 。 如 果 有 两 名 同学 同时 注册 这 门 课程 ， 那 么 系统 必须 保证 它们 之 中 
最 多 只 有 一 人 能 成 功 。 

为 确保 正确 的 并 发 调度 ， 一 个 办 法 就 是 顺序 运行 所 有 事务 ， 一 次 执行 一 个 事务 。 因 此 ， 
当 有 两 名 同学 同时 试图 注册 以 得 到 课程 的 最 后 一 个 名 额 时 ， 先 运行 注册 事务 的 那 名 同学 就 能 
成 功 注册 ， 而 后 运行 注册 事务 的 那 名 同学 就 会 被 告知 ,选课 人 数 已 满 。 这 种 事务 执行 的 方式 
称 为 串 行 的 (serial)， 每 个 事务 的 执行 是 隔离 的 (isolated )， 即 ACID 中 的 I。 

让 我 们 回顾 为 什么 会 出 现 隔 离 性 问题 。 回 忆 一 下 ， 我 们 假设 事务 是 一 致 的 ， 即 ACID 中 的 
C。 它 表明 ， 如 果 数 据 库 处 于 一 致 性 的 状态 ,并 且 事 务 的 执行 是 隔离 的 ， 那么 它 就 能 正确 执行 
由 于 数据 库 已 经 返回 到 一 个 一 致 性 的 状态 ， 我 们 可 以 开始 第 二 个 事务 的 执行 。 同 时 因为 第 二 
个 事务 也 是 一 致 的 ， 所 以 它 也 能 正确 执行 。 因 此 ， 如 果 数 据 库 的 初始 状态 是 一 致 性 的 ， 那 么 
事务 集 的 顺序 执行 ( 即 一 次 只 有 一 个 事务 在 执行 ) 是 正确 的 。 

但 是 ， 上 顺序 执行 是 不 实际 的 。 数 据 库 是 许多 应 用 操作 的 中 心 ， 所 以 会 被 经 常 访问 。 让 事 
务 顺 序 执行 的 系统 是 不 能 满足 负载 要 求 的 。 而 且 ， 很 容易 看 到 ， 在 许多 情况 下 ， 顺 序 执行 是 
不 必要 的 。 例 如 ， 如 果 事 务 Ti 访问 表 X 和 Y， 事 务 T, 访 问 表 U 和 V， 则 T, 和 T, 的 操作 可 以 交叉 进 
行 ， 此 时 最 终 的 结果 (包括 数据 库 管理 系统 返回 给 事务 的 信息 以 及 数据 库 的 最 终 状 态 ) 在 先 
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， 则 交叉 调度 也 一 定 是 正确 的 。 

事务 集 的 交叉 执行 比 该 事务 集 的 顺序 执行 可 能 高 效 得 多 。 事 务 的 执行 要 求 多 个 系统 资源 
(主要 有 CPU 和 IO 信道 ) 的 服务 。 但 一 个 事务 的 执行 一 次 通常 只 使 用 其 中 的 一 个 资源 ， 多 个 
事务 的 并 发 执行 就 能 同时 利用 这 些 资源 ， 因 此 也 就 提高 系统 的 吞吐 量 。 例 如 ， 当 CPU 在 为 一 
个 事务 做 计算 时 ，LIO 信 道 可 以 为 另 一 个 事务 提供 MO 服务 。 

但 有 些 交叉 调度 会 使 一 致 的 事务 运行 不 正确 ， 给 应 用 返回 错误 的 结果 ， 使 数据 库 处 于 不 
一 致 性 状态 。 因 此 ， 我 们 不 允许 任意 的 交叉 。 第 一 个 问题 是 我 们 怎样 决定 娜 种 交叉 是 好 的 ， 
哪 种 交叉 不 好 。 下 一 个 问题 是 我 们 怎样 实现 一 个 算法 来 执行 好 的 交叉 ， 同 时 禁止 不 好 的 事务 
交叉 。 我 们 把 这 样 的 算法 叫做 并 发 控制 (concurrency control)。 这 些 就 是 本 章 要 讨论 的 问题 。 

在 大 多 数 商 业 事务 处 理 系统 中 ， 并 发 控制 是 自动 完成 的 ， 对 应 用 程序 员 来 说 是 不 可 见 的 ， 
应 用 程序 员 设计 每 个 事务 ， 就 好 像 事务 在 一 种 非 并 发 环境 中 执行 一 样 。 并 发 控制 允许 并 发 执 
行 ， 它 必须 确保 每 一 个 事务 相对 于 另 一 个 事务 来 说 是 隔离 的 ， 毫 无 疑问 ， 理 解 并 发 操作 控制 
的 基本 概念 很 重要 ， 这 是 因为 : 
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1) 使 用 并 发 控制 来 实现 隔离 〈 而 不 只 是 任意 交叉 ) 能 有 效 地 缩短 响应 时 间 ， 明 显 降低 事 
务 的 吞吐 量 〈 用 每 秒 的 事务 量 来 衡量 )。 因 此 ， 许 多 商业 系统 允许 在 运行 多 个 事务 与 降低 隔离 
的 级 别 之 间 做 出 选择 (有 时 是 作为 缺 省 值 )。 因 为 有 些 设 计 人 员 可 能 试图 选择 其 中 的 一 种 方案 
来 提高 系统 效率 ， 所 以 理解 降低 隔离 级 别 如 何 导致 数据 库 出 现 不 一 致 的 状态 和 不 正确 的 结果 
是 很 重要 的 。 

2) 设计 者 可 以 在 实现 完全 隔离 和 降低 隔离 级 别 之 间 进 行 选择 ， 并 发 控制 与 应 用 程序 内 表 
和 事务 设计 之 间 的 交互 会 严重 影响 应 用 的 执行 效率 。 

隔离 性 是 一 个 复杂 的 问题 。 因 此 ， 我 们 的 讨论 分 成 两 部 分 。 在 这 一 章 ， 我 们 主要 对 抽象 
数据 库 系 统 上 的 隔离 性 感 兴趣 。 这 里 的 抽象 是 指 : 数据 库 中 的 每 个 数据 项 都 有 一 个 名 字 ， 对 
它们 的 访问 可 以 使 用 名 字 来 进行 读 写 操作 。 第 24 章 着 重 介绍 关系 数据 库 系统 上 的 隔离 ， 其 中 
数据 是 使 用 SQL 语句 来 访问 的 ， 而 SQL 语句 使 用 条 件 来 确定 要 处 理 的 行 。 在 抽象 的 数据 库 上 
学 习 隔 离 性 ， 有 助 于 我 们 关注 并 发 控制 的 关键 问题 。 对 特定 的 关系 数据 库 ， 就 能 用 一 个 完好 
的 技术 来 处 理 抽象 问题 。 


23.1 调度 和 等 价 调度 


我 们 感 兴趣 的 并 发 控制 可 以 在 任何 应 用 中 使 用 。 我 们 并 不 讨论 为 某 特 定 应 用 设计 的 并 发 
控制 。 而 且 ， 我 们 也 不 关注 利用 特定 事务 执行 的 计算 信息 进行 控制 的 问题 ， 我 们 关注 的 是 这 
样 的 控制 ， 它 在 不 知道 事务 将 做 什么 的 情况 下 ， 一定 能 把 好 的 事务 交 又 调度 与 不 好 的 事务 交 
又 调度 区 分 开 来 。 例 如 ， 事 务 可 能 读 取 数据 库 中 一 个 变量 的 值 。 如 果 并 发 控制 知道 这 个 变量 
表示 某 银行 账户 的 余额 ， 那 么 作为 储 蔷 的 第 一 步 ， 事 务 将 请 求 读数 据 ， 它 可 能 选择 可 接受 的 
交叉 调度 来 使 用 信息 。 但 我 们 假设 ， 这 样 的 信息 对 并 发 控制 来 说 是 不 可 用 的 。 

如 果 不 能 使 用 特定 应 用 程序 的 信息 ， 我 们 怎样 才能 判断 出 哪 种 交叉 调度 是 正确 的 呢 ? 答 
案 在 我 们 的 假设 中 ， 即 每 个 事务 是 一 致 的 ， 因 而 串 行 调度 必定 是 正确 的 。 从 这 里 我 们 可 以 看 
出 ， 我 们 使 用 的 正确 性 准则 是 : 所 产生 的 结果 与 串 行 调度 执行 的 结果 一 样 的 交叉 调度 必定 是 
正确 的 。 以 后 我 们 将 对 “和 一 个 串 行 调度 有 相同 的 结果 ”进行 提炼 ， 但 你 必须 理解 ， 这 是 传 
统 的 正确 性 的 概念 。 对 大 多 数 应 用 来 说 ， 可 能 有 很 多 可 接受 的 非 串 行 执行 的 方法 ， 因 此 ,“ 不 
正确 ”是 相对 于 我 们 的 准则 而 言 的 ， 因 为 我 们 假设 事务 正在 处 理 的 信息 是 不 能 被 利用 的 。 

我 们 假设 ， 一 个 事务 是 一 个 程序 ， 它 的 数据 空间 包括 数据 库 和 局 部 变量 。 而 局 部 变量 仅 
能 被 这 个 事务 访问 。 数 据 库 是 全 局 性 的 ， 所 有 的 事务 都 可 以 访问 它 。 事 务 使 用 不 同 的 机 制 访 
问 数据 空间 中 的 数据 库 和 局 部 变量 。 对 事务 来 讲 ， 局 部 变量 是 直接 访问 的 〈 即 局 部 变量 在 它 
的 实际 内 存 中 )， 但 数据 库 只 能 通过 调用 数据 库 管理 器 提供 的 过 程 来 访问 。 例 如 ， 在 一 个 层次 
非常 低 的 实现 细节 上 ， 事务 请 求 数据 库 管 理 器 从 数据 库 中 复制 一 个 数据 块 到 它 的 局 部 变量 中 ， 
这 是 读 请 求 (read request)， 或 者 请 求 把 存储 在 局 部 变量 中 的 数据 写 到 数据 库 中 去 ， 这 是 写 请 
求 (write request)。 在 这 一 层次 上 ， 我 们 把 数据 库 看 作 是 一 个 数据 项 集 ， 并 且 假 设 不 知道 数 
据 项 中 数据 的 类 型 。 而 且 ， 我 们 对 数据 库 的 存储 位 置 不 做 假设 。 大 多 数 情况 下 ， 数 据 存储 在 
大 容量 的 存储 设备 上 ， 但 要 求 它 做 出 快速 响应 时 ， 它 就 可 能 存储 在 主 存 中 。 

一 个 事务 是 一 个 程序 ， 在 这 个 程序 内 ， 使 用 局 部 变量 的 计算 和 提交 给 数据 库 管理 器 的 数 
据 库 访问 请 求 是 交织 在 一 起 的 。 因 为 计算 是 在 主 存 中 完成 的 ， 对 数据 库 管 理 器 来 说 是 不 可 见 
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的 ， 所 以 它 把 事务 的 执行 看 作 是 一 个 读 写 请 求 序列 ， 我 们 把 这 个 序列 叫做 事务 的 调度 
(transaction schedule )。 如 果 疡 是 Ti 所 做 的 第 /个 请 求 ， 则 
Pias Pi2> ---> Pin 

是 事务 IT 的 调度 ， 它 由 z 个 对 数据 库 的 请 求 组 成 。 

因为 事务 是 并 发 执行 的 数据库 管 理 器 必须 处 理事 务 调 度 的 合集 ， 我 们 把 它 简单 地 称 为 
调度 (schedule)。 数 据 库 管理 器 负责 为 每 个 到 来 的 请 求 提 供 服务 ， 但 按 它们 到 达 的 先后 顺序 
提供 服务 可 能 是 不 正确 的 。 因 此 ， 当 一 个 请 求 到 达 时 ， 必 须 决 定 是 否 需要 立即 为 其 提供 服务 ， 
这 样 的 决定 是 由 并 发 控制 来 完成 的 。 如 果 并 发 控制 决定 立即 为 一 个 请 求 提供 服务 可 能 导致 一 
个 不 正确 的 调度 ， 它 就 延迟 一 段 时 间 后 再 提供 服务 ， 或 者 它 可 能 连同 请 求 事务 一 起 中 止 。 

因此 ， 在 并 发 控制 下 ,数据库 管 理 器 所 提供 的 服务 调度 可 能 和 请 求 到 达 的 序列 是 不 一 样 
的 。 一 般 情况 下 ， 并 发 控制 会 记录 这 些 请 求 。 当 然 ， 它 不 会 只 记录 一 个 事务 的 请 求 。 因 为 我 
们 假设 事务 是 一 个 顺序 执行 的 程序 ， 在 前 一 个 请 求 得 到 服务 之 前 ， 它 不 会 再 提交 另 一 个 请 求 。 
并 发 控制 的 目的 就 是 按 到 达 的 调度 记录 不 同事 务 的 请 求 ， 以 便 产 生 一 个 正确 的 调度 ， 让 数据 
库 管 理 器 提供 服务 。 系 统 的 组 织 如 图 23-1 所 示 。 





到 达 请 求 的 调度 








数据 库 服务 器 
\ \ ” 得 到 服务 的 请 求 的 调度 
客户 机 事务 调度 

图 23-1 数据 库 系统 中 并 发 控制 的 角色 


注意 ， 传 输 到 达 的 调度 表 是 有 开销 的 : 事务 可 能 被 延迟 ， 或 被 异常 中 止 。 事 务 的 延迟 会 
降低 系统 中 并 发 执行 的 程度 ， 因 此 增加 了 系统 的 平均 反应 时 间 ， 同 时 降低 了 吞吐 量 。 异 常 中 
止 事务 是 较 差 的 一 种 情形 ， 因 为 它 要 求 计算 必须 重 做 。 所 以 ， 并 发 控制 做 必要 的 转换 ， 但 必 
须 是 有 尽 可 能 多 的 调度 表 。 并 发 控制 一 般 不 能 识别 出 所 有 正确 的 调度 ， 因 此 有 时 会 作 一 些 不 
必要 的 转换 操作 。 设 计 一 个 并 发 控制 的 目标 就 是 要 最 小 化 这 种 开销 。 . 

我 们 假设 ， 相 对 于 其 他 的 数据 库 操 作 而 言 ， 每 个 数据 库 的 操作 是 原子 性 和 隔离 性 的 ， 尽 
管 我 们 已 经 假设 并 发 控制 不 知道 事务 的 语义 ( 即 计算 的 实质 )， 但 我 们 假设 它 知道 每 个 数据 库 
操作 产生 的 影响 ， 我 们 把 它 称 为 操作 语义 (operation semantics)。 在 这 一 章 中 ， 我 们 主要 考虑 
读 写 操作 。 在 下 一 章 中 ， 我 们 考虑 关系 数据 库 上 的 操作 ， 如 SELECT 和 UPDATE、 

等 价 调度 ; 

操作 的 语义 可 用 来 决定 可 行 的 调度 。 为 解释 是 如 何 确定 可 行 的 调度 ， 我 们 必须 先 解释 机 
个 等 价 调度 的 含义 。 如 果 对 于 所 有 可 能 的 初始 数据 库 状 态 可 以 满足 下 列 条 件 ， 我 们 就 说 两 个 
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数据 库 的 操作 pi 和 p: 是 可 以 交换 的 。 

。 按 顺序 pi,pz 或 者 pz,p1 执 行 ，p! 返 回 同 样 的 结果 。 

。 按 顺序 p1,p; 或 者 p2,p! 执 行 ，p2 返 回 同样 的 结果 。 

。 按 这 两 种 顺序 执行 所 产生 的 数据 库 状 态 是 一 样 的 。 

假设 p!: 和 ps 是 两 个 不 同事 务 发 出 的 请 求 ， 并 且 在 调度 51 中 是 连续 的 操作 ， 则 S, 有 下 面 的 
形式 : 

Sits Pis Po» Siz 
HS AES AER, SiS RR. BARERA R, ZED RES PA: 
Sias P2» Pis Siz 

调度 S: 中 所 有 事务 执行 的 计算 与 在 调度 S 所 有 事务 完成 的 计算 相同 ， 因 为 这 两 个 调度 返回 
给 每 个 事务 的 值 是 一 样 的 。 而 且 ， 这 两 个 调度 使 数据 库 处 于 相同 的 终 态 ， 因 此 ， 我 们 就 说 调 
度 S1 和 Ss 是 等 价 的 (equivalent)。 不 可 交换 的 操作 是 冲突 的 。 

最 重要 的 是 ， 两 个 对 不 同 数据 进行 的 操作 总 是 可 以 交换 的 。 对 同一 个 数据 的 操作 有 可 能 
可 以 互 换 。 例 如 ， 两 个 对 同一 个 数据 的 读 操 作 是 可 互 换 的 ， 但 对 同一 个 数据 的 读 和 写 操作 是 
冲突 的 ， 因 为 尽管 数据 的 最 终 状态 独立 于 它们 的 执行 顺序 ， 但 读 到 的 值 取决 于 操作 的 执行 顺 
序 。 类 似 地 ， 两 个 写 操作 也 是 冲突 的 ， 因 为 数据 的 最 终 状 态 取决 于 写 操作 发 生 的 顺序 。 

在 任意 的 调度 中 ， 可 交换 的 、 属 于 不 同事 务 的 连续 操作 可 以 相互 交换 以 产生 与 原来 调度 
等 价 的 新 调度 。 因 为 等 价 是 传递 的 ， 所 以 我 们 能 够 证 明 两 个 调度 的 等 价 性 ， 这 两 个 调度 可 合 
并 成 同一 事务 的 调度 集 ， 但 使 用 这 样 简单 的 顺序 交换 ， 实 质 是 不 同 的 。 且 这 种 交换 对 并 发 控 
制 却 是 件 难 事 。 

大 多 数 并 发 控制 设计 是 基于 以 下 原理 的 ， 它 是 用 另 一 种 方法 来 证 明 调 度 的 等 价 性 : ， 

定理 (等 价 调度 ): 当 且 仅 当 冲 罕 操 作 在 这 两 个 调度 中 按 相同 的 顺序 执行 ， 同 一 操作 集 的 
两 个 调度 是 等 价 的 。 

注意 ， 如 果 我 们 能 证 明 下 面 的 命题 ， 我 们 就 能 证 明 这 个 定理 : 

当 且 仅 当 冲 突 操作 在 这 两 个 调度 中 以 相同 的 顺序 执行 时 ， 通 过 交换 可 交换 的 操作 ， 

调度 Ss 可 从 SI 得 到 。 

因为 我 们 知道 ， 当 且 仅 当 其 中 的 一 个 调度 可 以 通过 交换 可 交换 的 操作 从 另 一 个 调度 得 到 ， 
两 个 调度 是 等 价 的 。 - 

“ 仅 当 ”是 定理 的 一 部 分 ， 在 交换 过 程 中 ， 保 留 冲 突 操作 的 执行 顺序 。 因 此 ， 如 果 冲 突 操 
作 在 两 个 调度 中 的 执行 顺序 不 同 ， 那 么 S$, 就 不 能 通过 交换 从 Si 中 得 到 。 

“ 当 ” 是 定理 中 更 加 复杂 的 一 部 分 。 可 以 这 样 来 证 明 ， 若 任意 的 调度 S; ( 和 Si 有 相同 的 操 
ER) 的 冲突 操作 和 S; 的 冲突 操作 有 相同 的 顺序 ， 那 么 就 可 以 通过 交换 从 Si 产生 。 为 表示 这 个 
过 程 ， 考 虑 调度 S): 

«Pis Pinis Pizos oes Pirs 

假设 S: 是 与 S; 有 相同 操作 集 的 调度 ， 冲 突 操 作 的 顺序 也 和 Si, 相同 。 而 且 ， 假 设 所 有 的 /请 

足 1<j<r-1， Di 和 pi 在 Si 和 S$:z 中 有 相同 的 顺序 ， 但 pz 和 Pi 的 顺序 不 同 。 因此 pi;, 是 $1 中 pi 之 后 
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的 第 一 个 操作 ， 而 在 $s 中 却 有 不 同 的 顺序 ，pi,,: 是 先 于 p, 的 。 操 作 p; 和 pi,, 必 须 能 够 交换 ， 央 为 
冲突 操作 在 S, 和 S: 中 有 相同 的 顺序 。 

现在 假设 有 Kk 满足 1 <k<r-1， 这 样 pi;, 就 不 能 与 px 交换 。 在 S; 中 ， 操 作 必 须 有 这 样 的 
顺序 : 

sDitks Pirrs e9 Pis one 

这 是 因为 冲突 操作 在 两 个 调度 中 有 相同 的 顺序 。 但 这 是 与 假设 相 矛 盾 的 ， 在 假设 中 ，Piv 
是 S 中 站 之 后 的 第 一 个 操作 ， 这 和 S: 中 的 操作 顺序 是 不 同 的 。 

由 于 这 个 原因 ， 假 设 存在 一 个 ， 满 足 1 <k< r-1， 使 操作 p;,, 不 能 与 pi,x 交 换 是 错误 的 。 因 
此 ，pi,;: 能 与 p:，.…，pis;-! 中 所 有 的 操作 交换 。 而 且 ， 在 通过 交换 相 邻 操作 产生 的 不 同 于 S1 却 和 
Si! 等 价 的 调度 中 ， 交 换 后 的 操作 中 pi;, 先 于 p;， 而 不 是 pi 在 pi 之 后 (在 Ss 中 也 是 如 此 )。 交 换 过 
程 是 可 重复 的 ， 操 作 顺 序 不 同 就 使 S 变 成 S:。 


23.1.1 ME 


我 们 已 经 看 到 ， 如 果 冲 突 操作 在 两 个 调度 中 的 顺序 相同 ， 则 调度 是 等 价 的 。 使 用 这 一 规 
则 ， 我 们 就 可 以 定义 和 串 行 调度 等 价 的 交叉 调度 ， 这 是 并 发 控制 所 允许 的 。 我 们 把 这 样 的 调 
度 称 为 可 串 行 化 调度 [Eswaran et al. 1976]. 

如 果 一 个 调度 和 一 个 串 行 调度 等 价 ， 即 这 两 个 调度 中 的 冲突 操作 有 相同 的 顺序 ， 那 

么 这 个 调度 是 可 串 行 化 的 (serializable ) 。 

可 串 行 化 调度 的 概念 为 我 们 的 第 一 个 问题 提供 答案 : 我 们 怎样 确定 哪 种 交叉 调度 是 正 
确 的 。 

因为 可 事 行 化 调度 是 和 串 行 调度 等 价 的 ， 并 且 因 为 我 们 假设 所 有 事务 都 是 一 致 性 的 ， 

所 以 任何 一 个 事务 的 可 串 行 化 调度 是 正确 的 9 。 

可 串 行 化 调度 对 任何 应 用 来 说 都 是 正确 的 。 但 对 特定 应 用 而 言 ， 可 趾 行 性 的 条 件 要 求 太 
高 〈 这 个 应 用 事务 的 非 串 行 化 调度 也 有 可 能 是 正确 的 )， 并 且 有 可 能 导致 不 必要 的 性 能 损失 。 
因此 ， 并 发 控制 通常 实现 不 同 的 隔离 级 别 ， 最 强 的 隔离 级 产生 可 串 行 化 的 调度 ， 应 用 设计 人 
员 可 以 为 特定 应 用 选择 合适 的 隔离 级 别 。 在 本 章 中 ， 我 们 只 处 理 可 串 行 化 调度 。 我 们 将 在 第 
24 章 讨论 最 严格 的 隔离 级 别 。 

为 说 明 串 行 的 含义 ， 假设 pi 和 p12z 是 事务 T! 的 两 个 连续 的 数据 库 操作 请 求 ， 而 pzt 和 p22 是 
事务 T 的 两 个 连续 的 数据 库 操作 请 求 。 一 个 交叉 操作 序列 是 : 

Pin» Poss Pi2, P22 

如 果 交 换 pz 和 pi， 那么 这 个 交叉 序列 和 串 行 调 度 

Pui, Piz> Pais P22 
等 价 ， 因 而 是 正确 的 。 


O 与 此 相反 的 结论 是 ， 如 果 调 度 是 不 可 串 行 化 的 ， 那 么 一 定 存在 某 个 完整 性 约束 ， 而 调度 违反 了 这 个 完整 性 
约束 ，[Rosenkrantz et al. 1984] 证 明了 这 一 结论 。 





23 Ë RHEA 571 


图 23-2a 显 示 了 两 个 事务 调度 ， 每 个 事务 在 不 同 的 线 上 表示 ， 了 时 间 从 左 到 右 递增 。 总 调度 
是 这 两 个 事务 调度 的 汇集 ， 在 空间 上 表示 它们 交叉 进行 。 其 中 r(x) 表 示 读 数据 项 x，w(x) 表 示 
写 数 据 项 。 在 调度 中 ， 某 -- 时 刻 数据 项 的 值 是 上 一 次 写 入 的 那个 值 ， 如 果 前 面 没 有 写 操 作 ， 
则 数据 的 值 为 初 值 。 

图 23-2 的 a 中 调度 是 交叉 ( 非 序列 的 ) 的 ， 因 为 Ti 的 有 些 操作 发 生 在 1 之 前 ， 另 一 些 在 T: 
之 后 。 图 23-2b 中 的 调度 是 串 行 的 ， 在 T: 开 始 之 前 ，T' 已 经 结束 。 图 23-2a 中 事务 T: 对 x 的 读 写 
操作 与 Ti 对 y 的 读 写 操作 是 可 以 交换 的 ， 所 以 ， 通 过 一 系列 相 邻 操作 的 交换 ， 图 23-2a 可 以 转换 
成 图 23-2b。 因 此 ， 图 23-2a 中 的 调度 是 可 串 行 化 的 。 


r(x) 





图 23-2 a) 可 串 行 化 调度 ; b) 等 价 的 串 行 调度 


现在 我 们 从 调度 等 价 定理 来 考虑 这 两 个 调度 ， 两 个 事务 中 了 唯一 的 冲突 操作 是 T 的 r(x) 和 T， 
的 w(x)， 因 为 它们 在 图 23-2a 和 图 23-2b 中 的 顺序 相同 ， 所 以 这 两 个 事务 是 等 价 的 。 

最 后 请 注意 ， 尽 管 图 23-2a 的 调度 和 图 23-2b 串 行 调度 TiT: 是 等 价 的 ， 但 却 和 串 行 调 度 T2T， 
不 等 价 。 

作为 另 一 个 例子 ， 图 23-3 中 的 调度 不 是 可 串 行 化 的 ， 因 为 Ti 读 x* 之 后 ，T: 写 r， 在 任何 等 
价 的 串 行 调度 中 ，T: 必 须 跟 在 Ti 的 后 面 (因为 它 的 写 操作 是 不 能 和 T, 的 读 操 作 交 换 的 ， 所 以 
不 能 改变 它们 的 顺序 )。 类 似 地 ， 因 为 Ti 在 T; 


读 y 之 后 写 》， 所 以 在 任何 等 价 的 品行 序列 中 ， | O a w 
T: 必 须 跟 在 Ti 之 后 。 因 为 Ti 不 能 同时 既 处 在 T， > 

之 前 ， 又 处 在 T; 之 后 ， 所 以 没有 串 行 的 等 价 、 图 23-3 非 可 电 行 化 的 调度 

序列 。 


FRE vy BF 化 调度 和 串 行 调度 之 间 等 价 问题 的 争论 是 基于 操作 的 可 交换 性 和 重 排序 ， 但 
在 执行 一 个 调度 前 ， 并 发 控制 并 不 对 可 串 行 化 调度 的 操作 重新 排序 。 因 为 可 串 行 化 调度 和 串 
行 调度 所 产生 的 结果 是 一 样 的 ， 所 以 设 有 必要 对 操作 进行 重新 排序 。 如 果 并 发 控制 能 确定 已 
到 达 的 操作 序列 是 可 串 行 化 调度 的 前 绥 ， 那 么 不 管 以 后 提交 什么 操作 ， 它 都 按 操作 到 达 的 顺 
序 执行 。 但 如 果 不 是 这 样 ， 操 作 就 必须 推迟 执行 ， 可 能 需要 重新 排序 以 便 保 证 整个 调度 可 串 
行 化 。 稍 后 我 们 对 如 何 完成 重 排序 加 以 阐述 。 


23.1.2 冲突 等 价 与 观察 等 价 
我 们 已 经 知道 ， 如 果 溃 突 操 作 在 这 两 个 调度 中 有 相同 的 顺序 ， 那 么 两 个 调度 是 等 价 的 。 
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但 实际 上 ， 这 里 有 两 个 不 同 的 等 价 概念 : 一 个 是 我 们 已 描述 过 的 ， 因 为 它 特定 的 属性 而 称 为 
冲突 等 价 (conflict equivalence) 的 等 价 概念 ， 第 二 个 是 称 为 观察 等 价 (view equivalence) 的 
等 价 概念 。 如 果 两 个 调度 满足 下 列 两 个 条 件 ， 那 么 它们 是 观察 等 价 的 : 

1) 每 个 调度 中 相对 应 的 读 操作 返回 相同 的 值 (因此 ， 在 这 两 个 调度 中 ， 所 有 的 事务 完成 
相同 的 计算 ， 写 相同 的 值 到 数据 库 中 ) 。 

2) 两 个 调度 产生 相同 的 最 终 数据 库 状 态 。 

第 一 个 条 件 表明 ， 这 两 个 调度 中 的 事务 有 相同 的 数据 库 视图 ， 视 图 等 价 因此 而 命名 。 第 
二 个 条 件 是 必要 的 ， 因 为 尽管 两 个 调度 中 的 事务 写 相 同 的 值 到 数据 库 中 ， 但 如 果 写 操作 以 不 
同 的 顺序 发 生 ， 那 么 这 两 个 调度 可 能 使 数据 库 最 终 处 于 不 同 的 状态 。 第 二 个 条 件 对 写 语 名 的 
顺序 进行 限制 ， 要 求 数据 库 的 最 终 状 态 是 相同 的 : 在 每 一 个 调度 中 ， 最 终 的 写 数 据 项 的 操作 
必须 相同 。 1 

冲突 等 价 条 件 是 保证 视图 等 价 的 充分 条 件 ， 但 不 是 必要 条 件 。 在 某 些 情 形 下 ， 它 的 要 求 
更 加 严格 。 相 应 地 ， 视 图 等 价 比 冲 突 等 价 更 具 一 般 性 〈 即 条 件 要 弱 一 些 )。 尽 管 两 个 冲突 等 价 
调度 是 视图 等 价 的 《在 练习 23.6 中 要 求证 明 )， 但 视图 等 价 并 不 一 定 是 冲突 等 价 : 它 不 可 能 通 
过 交换 相 邻 操作 而 从 另 一 个 调度 得 到 。 

例如 ， 如 图 23-4 所 示 的 调度 ， 它 与 任何 一 个 串 行 化 的 调度 都 不 是 冲突 等 价 的 。 在 T: 和 Ti, 中， 
各 自 对 y 的 读 写 操作 是 不 能 交换 的 ， 因 此 ， 如 果 存 在 冲突 等 价 的 串 行 调度 ，T: 必 须 在 Ti 之 前 。 
另 一 方面 ， 这 些 事务 对 x 的 两 个 写 操作 也 是 不 能 交换 的 ， 这 表明 如 果 存 在 一 个 冲突 等 价 的 串 行 
调度 ，Ti: 必 须 先 于 T:， 这 是 前 后 矛盾 的 。 注 意 ， 事 务 按 T:、Ti、Ts 的 顺序 执行 , 串 行 调度 所 产 
生 的 结果 与 图 23-4 中 显示 的 调度 所 产生 的 结果 相同 : x 和 y 最 终 有 相同 的 最 终 状 态 ， 返 回 给 Ts 的 
作为 读 取 y 的 结果 的 值 相同 。 因 此 图 23-4 中 的 调度 与 申 行 调度 TT/T; 是 视图 等 价 的 ， 所 以 它 是 
可 串 行 化 的 。 


wO) w(x) 





图 23-4 表明 观察 等 价 不 一 定 是 冲突 等 价 的 调度 


尽管 可 以 基于 视图 等 价 来 设计 并 发 控制 (或 许可 以 获得 另外 的 并 发 ， 因 为 允许 串 行 化 程 
度 更 高 的 调度 ) ， 但 这 样 的 控制 实现 起 来 是 很 困难 的 。 因 此 ， 并 发 控制 通常 基于 冲突 等 价 在 余 
下 的 部 分 中 ， 除 特殊 声明 外 ， 我 们 使 用 “等 价 ” 表 示 冲 突 等 价 。 
23.13 串 行 图 

另外 一 个 考虑 冲突 串 行 调度 的 办 法 就 是 基于 串 行 图 。 某 个 已 提交 事务 的 调度 S 的 串 行 图 
(serialization graph) 是 一 个 有 向 图 ， 其 中 的 节点 代表 参与 调度 的 事务 。 

如 果 在 调度 S 中 ， 

1) Ti 中 的 某 些 数据 库 操作 p; 与 中 的 某 些 操作 pj 冲突 。 

2) 在 S 中 Pi 出 现在 户 之 前 。 

那么 在 有 向 图 中 存在 有 向 边 ， 从 代表 事务 Ti 的 节点 指向 代表 事务 Ti 的 节点 ， 即 Ti 了 T。 
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例如 ， 对 应 图 23-2a 的 串 行 图 由 下 面 一 条 边 组 成 : 
T,-T, 
因为 T, 写 x 的 操作 在 TI! 读 x 之 后 。 
如 果 有 一 条 从 Ti 到 Ti 的 有 向 边 出 现在 表示 S 的 串 行 图 中 ， 则 对 于 任何 调度 ， 我 们 得 出 结论 ， 
T 一 定 要 在 Ti 之 前 ， 它 才 会 与 S 冲 突 等 价 。 从 这 里 我 们 可 以 看 出 ， 如 果 我 们 想 通 过 交换 可 交换 
的 操作 来 得 到 冲突 等 价 的 串 行 调度 ， 那 么 我 们 不 能 交换 产生 有 向 边 的 冲突 操作 。 例 如 ， 在 任 
何 一 个 冲突 等 价 于 图 23-2a 的 调度 中 ，Ti: 必 须 先 于 T:， 因 为 T: 对 x 的 写 操作 不 能 与 Ti 对 x 的 读 操 
作 交 换 。 l 
一 个 特定 调度 的 串 行 图 可 用 来 推导 这 个 调度 的 可 串 行 化 方法 。 如 图 23-3 所 示 ， 调 度 的 串 
行 图 有 两 条 边 : 
Ti 7T, 
因为 T: 对 x 的 写 在 Ti 对 x 的 读 之 后 ， 另 一 条 边 是 
T:>T, 
因为 Ti 对 ?7 的 写 在 T: 对 y 的 读 之 后 ， 这 两 条 边 构 成 一 个 循环 : 
T,7T.7-T, 
因此 ， 我 们 可 以 得 出 结论 ， 在 任何 等 价 的 串 行 调度 中 ，T, 必 须 先 于 Tz， 同 时 T: 又 必须 先 于 
Ti。 很 明显 ， 这 是 不 可 能 的 ， 因 此 我 们 说 不 存在 等 价 的 串 行 调 度 ， 图 23-3 所 示 的 调度 是 不 可 
串 行 化 的 。 更 一 般 地 ， 我 们 可 以 得 出 下 面 的 结论 : 
定理 ( 串 行 图 ): 当 且 仅 当 它 的 事 行 图 不 存在 环 时 ， 调 度 是 冲突 可 事 行 化 的 。 
要 证 明 这 个 定理 ， 需 注意 ， 如 果 调 度 S 的 串 行 图 有 环 ， 那 么 我 们 可 以 运用 以 上 的 推理 来 
证 明 它 不 是 可 串 行 化 的 。 另 一 方面 ,假设 图 中 不 存在 环 ，Ti,,T;,,…,T;, 是 一 个 图 的 拓扑 有 序 。 
事务 ， 它 构成 一 个 与 之 相应 的 串 行 调度 S”“， 调 度 S” 冲 突 等 价 于 调度 S， 因 为 如 果 串 行 图 中 存 
在 一 条 从 T, 到 T, 的 边 ， 就 存在 T, 的 p, 操 作 与 T, 的 p, 操 作 相 冲 突 ， 在 调度 S 和 S*“ 中 ，p, 必 须 先 于 
P;。 因 为 在 这 两 个 调度 中 ， 溃 突 操作 是 有 序 的 ， 因 而 它们 是 等 价 的 (按照 前 面 的 调度 等 价 定 
理 )，S 是 冲突 可 串 行 化 的 。 
图 23-5a 是 一 个 比较 大 的 串 行 图 ， 它 没有 环 ， 因 此 可 对 应 于 一 个 可 捉 行 调度 。 图 中 有 许多 
拓扑 序列 ， 因 此 它 的 事务 存在 许多 冲突 等 价 串 行 调度 。 其 中 的 两 个 调度 如 下 : 
TIiT2T3T4TsT6T7 


和 
T,T3T5T.T¢6T7T4 
在 图 23-3b 中 ， 串 行 图 没有 相应 的 可 串 行 化 调度 ， 因 为 存在 环 : 
T27T.~-T,7T, 


O ” 非 循 环 有 向 图 的 拓扑 排序 是 图 中 任意 有 序 的 节点 序列 ， 这 些 顺 序 与 边 所 表示 的 顺序 是 一 致 的 。 一 个 非 循环 
图 可 能 有 多 个 拓扑 排序 。 
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T; 一 .1 


DS T, 


a 


图 23-5 两 个 串 行 图 


23.2 可 恢复 性 、 级 联 异 常 中 止 和 严格 性 


迄今 为 止 ， 我 们 的 讨论 是 由 可 串 行 性 引发 的 ， 我 们 假设 所 有 的 事务 最 后 都 提交 。 当 我 们 
考虑 可 能 有 一 个 事务 异常 中 止 时 ， 这 个 过 程 就 变 得 更 加 复杂 。 这 时 必须 对 调度 施加 额外 的 限 
制 。 当 事务 提交 时 ， 持 久 性 要 求 它 对 数据 库 所 做 的 任何 变化 是 长 久 的 和 不 易 委 失 的 。 当 事务 
异常 中 止 时 ， 必 须 和 它 没有 被 启动 所 产生 的 结果 一 样 ， 但 没有 提交 和 没有 异常 中 止 都 被 说 成 
是 活动 的 (active)。 

当 事 务 异 常 中 止 时 ， 它 对 数据 库 所 做 的 任何 修改 必须 清除 ， 即 事务 必须 回 退 (roll back). 
但 回 退 事务 对 数据 库 写 入 的 值 并 不 足以 保证 异常 中 止 的 事务 没有 产生 任何 影响 。 假设 T; 将 新 
值 写 入 x， 在 T, 终 止 前 我 们 允许 T, 读 取 x 的 值 ， 如 图 23-6a 所 示 。T, 的 读 操作 称 作 脏 读 (dirty 
read )， 因 为 T; 还 没有 提交 。 如 果 我 们 允许 事件 序列 “Ti 提交，T; 异 常 中 止 ” 发 生 ， 即 使 将 x 的 
值 回 退 到 T: 写 人 之 前 ，T 还 是 会 影响 Ti。 而 且 ， 因 为 Ti 已 经 提交 ， 信 息 已 经 写 和 人 数据库， 即 》 


的 新 值 已 经 保存 。 这 就 产生 严重 的 问题 : Ti 从 T:? 读 到 值 ， 即 使 T 异 常 中 止 ， 它 也 会 间接 地 影 


响 数 据 库 的 状态 。 

注意 ， 如 果 T: 不 异常 中 止 ， 图 23-6a 中 的 调度 是 可 串 行 化 的 ,“ 脏 读 ” 可 能 在 可 串 行 化 调度 
中 发 生 。 因 为 我 们 假设 不 能 阻止 一 个 事务 异常 中 止 ， 所 以 我 们 必须 施加 额外 的 限制 来 设计 并 
发 控制 ， 以 保证 以 上 情况 不 会 发 生 。 特 别 地 ， 在 以 上 的 情况 下 ， 我 们 不 允许 Ti 提交 。 如 果 T 
没有 提交 ， 我 们 就 可 以 在 T; 异 常 中 止 的 时 候 ， 也 异常 中 止 T|， 如 图 23-6b 所 示 。 

如 果 一 个 事务 Ti 读 事务 T: 所 写 的 数据 ， 在 事务 T: 提 交 之 前 ， 不 允许 Ti 提交 〈 因 此， 如 果 T: 
eee, TER AIE), PAH REA RMB (recoverable) [Hadzilacos 1983], 
我 们 要 求 所 有 的 并 发 控制 是 可 恢复 的 。 由 可 恢复 的 并 发 控制 所 产生 的 调度 称 为 可 恢复 调度 。 

注意 ， 即 使 事务 不 异常 中 止 ， 也 不 希望 读 取 脏 数 据 。 事 务 T: 可 能 多 次 更 新 一 个 数据 项 ， 
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并 发 事务 T, 读 取 脏 数据 可 能 看 到 它 的 中 间 值 ， 如 图 23-7 所 示 。 从 直觉 上 我 们 可 以 得 出 结论 ， 
它 不 是 可 串 行 化 调度 ， 因 为 在 串 行 调度 中 ， 中 间 值 是 不 能 被 读 取 的 。 由 于 T! 的 读 操作 与 T; 的 
两 个 写 操作 冲突 ， 所 以 图 23-7 中 的 调度 是 不 可 串 行 化 的 。 


(x) wO) 提交 





图 23-6 a) 不 可 恢复 的 调度 ; b) 相应 的 可 恢复 调度 
即使 一 个 并 发 控制 是 可 恢复 的 ， 它 还 可 能 


Ti: r(x) ”提交 


有 另外 一 种 不 好 的 性 质 : 级 联 异 常 中 止 。 当 一 Ta wa 
个 事务 的 异常 中 止 引 起 一 个 或 多 个 其 他 事务 的 
异常 中 止 时 ， 并 发 控制 就 出 现 级 联 异 常 中 止 图 23-7 不 可 恢复 的 调度 


(cascaded abort), 
假设 我 们 允许 事务 T; 写 人 数据 库 的 值 在 T; 终 止 前 ， 可 以 被 事务 Ts 读 取 ， 如 图 23-8 所 示 。 如 
果 现 在 T; 异 常 中 止 ， 那 么 Ts 也 必须 异常 中 止 ， 因 为 它 读 T; 写 入 的 值 。 由 于 同样 的 原因 ，T, 的 异 
常 中 止 又 引起 T, 的 异常 中 止 。 在 一 般 的 情形 下 ， 任 意 多 个 事务 可 能 被 迫 异 常 中 止 ， 这 是 不 可 
取 的 。 因 此 ， 我 们 要 求 并 发 控制 不 会 产生 级 联 异 常 中 止 。 
T: r) wo) See PE 


Ta: rx) wO) 异常 中 止 
T: w(x) 异常 中 止 


图 23-8 说 明 一 个 级 联 异 常 中 目的 可 恢复 调度 ，Ts 异 常 中 止 导致 异常 中 止 ， 
TRE PE EET RA HE 


如 果 禁 止 读 取 脏 数据 ， 那 么 并 发 控制 就 不 会 导致 级 联 异 常 中 止 。 这 个 条 件 比 可 恢复 条 件 
更 加 严格 ， 可 恢复 性 的 条 件 允 许 事务 Ti 读 一 个 活动 事务 季 写 人 的 值 ， 但 在 Ts 提交 前 ， 不 允许 Ti 
提交 。 但 我 们 选择 一 个 更 严格 的 条 件 ， 称 之 为 严格 性 。 如 果 它 不 允许 事务 读 或 写 由 一 个 活动 
事务 写 人 的 数据 ， 那 么 并 发 控制 是 严格 的 (strict) [Hadzilacos 1983]。 一 个 由 活动 事务 写 人 数 
. 据 的 写 操作 称 为 脏 写 (dirty write). 

显然 ， 严 格 的 并 发 控制 是 可 恢复 的 ， 不 会 出 现 级 联 异 常 中 止 ， 但 为 什么 我 们 要 对 写 施加 
额外 的 条 件 呢 ? 答案 在 于 ， 在 特定 的 情况 下 ， 这 样 能 更 加 有 效 地 实现 回 退 。 一 般 地 ， 当 我 们 
回 退 一 个 写 数据 x 所 产生 的 影响 时 ， 我 们 希望 将 * 的 值 复 原 到 写 操作 发 生 之 前 的 状态 。 假 设 我 
们 允许 x 首先 被 Ti, 修改、 然后 被 ,修改 ， 如 图 23-9 所 示 。 如 果 T! 异 常 中 止 ， 我 们 根本 不 必 恢复 
x 的 值 ， 因 为 它 的 值 已 经 被 T; 写 过 ， 而 Ts 没有 异常 中 止 。 如 果 现 在 Ts 也 异常 中 止 ， 我 们 必须 将 
x 的 值 恢复 到 它 被 T1 写 之 前 的 值 (不 是 T, 写 之 前 的 值 )。 尽 管 我 们 能 够 设计 系统 正确 地 处 理 这 
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样 的 情况 ， 但 严格 的 系统 设计 起 来 会 更 加 简单 ， 因 为 ， 我 们 总 是 能 通过 将 x 的 值 恢复 到 它 被 写 
之 前 的 值 来 回 退 写 操作 。 在 非 严 格 的 系统 中 ， 恢 复 算 甘 更 加 复杂 ， 需 要 对 多 个 事务 的 写 进行 
分 析 。 


Ty: w(x) 异常 中 止 
Tz: w(x) 异常 中 止 


图 23-9 表明 处 理 回 退 的 困难 性 的 调度 


23.3 并 发 控制 的 模型 


在 这 一 节 中 ， 我 们 给 出 几 个 事务 能 与 并 发 控制 和 数据 库 交 互 的 方法 。 与 数据 库 的 交互 可 
以 有 立即 更 新 和 延迟 更 新 两 种 。 

“ 在 立即 更 新 (immediate-update) 系统 中 ， 事 务 的 写 操作 导致 数据 库 中 相应 数据 项 的 立 

即 更 新 ， 读 操作 返回 数据 库 中 数据 项 的 值 。 可 能 出 现 读 操作 返回 还 未 提交 事务 写 人 的 值 ， 

这 意味 着 并 发 控制 不 是 严格 的 ， 但 我 们 将 看 到 ， 并 发 控制 算法 能 阻止 这 种 情况 的 发 生 。 

* 在 延迟 更 新 (deferred-updated) 系统 中 ， 事 务 的 写 操作 并 不 立即 更 新 数据 库 中 相应 的 数 

据 项 。 相 反 ， 信 息 被 保存 在 事务 中 称 为 意向 表 (intentions list) 的 特殊 地 点 。 事 务 的 读 

操作 将 返回 数据 库 中 相应 数据 项 的 值 ， 若 数据 已 被 修改 过 ， 则 返回 意向 表 中 的 值 。 当 事 

务 提交 时 ,意向 表 用 来 更 新 数据 库 。 注 意 ， 读 操作 返回 的 值 既 可 能 是 事务 本 身 写 入 的 值 ， 

也 可 能 是 已 提交 事务 写 人 的 值 。 

如 图 23-1 所 示 ， 并 发 控制 的 目的 就 是 将 对 数据 库 的 请 求 序列 转换 成 一 个 严格 的 可 串 行 化 
的 调度 。 当 事务 发 出 请 求 时 ， 控 制 必 须 决 定 是 否 允 许 处 理 请 求 。 控 制 知道 ， 到 现在 为 止 已 经 
被 数据 库 系 统 服务 的 〈 部 分 ) 调度 ， 但 不 知道 将 要 到 达 的 请 求 。 因 此 ， 它 必须 确保 ， 不 论 随 
后 有 什么 样 的 请 求 序列 到 达 ， 由 数据 库 系 统 处 理 的 调度 都 是 可 串 行 化 的 。 控 制 对 特殊 请 求 的 
响应 可 能 是 下 列 几 种 形式 : 

1) 允许 请 求 被 处 理 。 

2) 让 发 出 请 求 的 事务 等 待 ， 直到 有 其 他 事件 发 生 为 止 。 

3) 拒绝 请 求 (和 异常 中 止 事 务 )。 

并 发 控制 对 请 求 的 响应 分 为 同意 请 求 ( 如 上 面 的 第 一 种 响应 )、 延 迟 或 拒绝 。 基 于 这 一 点 ， 
并 发 控制 分 为 悲观 型 和 乐观 型 两 种 。 

* 在 悲观 (pessimistic) 系统 中 ， 无 论 事务 试图 对 数据 库 进行 什么 操作 ， 它 必须 得 到 并 发 

控制 的 许可 ， 但 事务 不 需要 请 求 被 允许 ， 可 以 在 任何 时 间 提 交 。 

* 在 乐观 (optimistic) 系统 中 ， 事 务 不 需 得 到 并 发 控制 的 许可 ， 就 可 以 对 数据 库 进 行 任何 

操作 ， 但 事务 的 提交 必须 得 到 并 发 控制 的 许可 。 

在 这 两 种 系统 中 ， 事 务 在 它 提 交 前 不 需要 任何 请 求 ， 可 以 在 任何 时 间 异 常 中 止 。 

悲观 并 发 控制 的 设计 是 基于 不 利 情况 有 可 能 出 现 的 心态 ， 即 事务 对 数据 库 的 访问 可 能 发 
生 冲 突 。 因 此 ， 悲 观 控制 对 每 个 请 求 进行 检查 ， 只 有 当 后 续 的 请 求 不 会 使 调度 变 成 非 可 串 行 
化 时 ， 才 允许 对 请 求 进行 处 理 。 控 制 做 出 “最 坏 情 况 ”的 决定 ， 因 此 被 称 为 翡 观 控制 。 因 为 
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它 能 确保 最 终 的 调度 是 可 串 行 化 的 ， 所 以 提交 请 求 总 是 能 被 批准 。 

另 一 方面 ， 乐 观 控 制 的 算法 是 基于 不 利 情况 不 可 能 出 现 的 心态 ， 即 事务 对 数据 库 的 访问 
不 可 能 发 生 冲 突 。 因 此 ， 乐 观 控制 立即 批准 每 个 访问 请 求 。 但 当 事 务 请 求 提交 时 ， 控 制 必 须 
检查 以 确保 不 利 情况 不 可 能 发 生 ， 否 则 ， 事 务 的 提交 请 求 不 被 批准 。 

对 大 型 数据 库 而 言 ， 乐 观 算 靶 是 比较 适用 的 ， 因 为 每 个 事务 只 对 数据 库 的 某 些 数据 项 进 
行 访问 ， 而 这 些 访 问 随机 地 分 布 于 整个 数据 库 。 这 样 的 假设 违反 得 越 多 ， 就 越 有 可 能 发 生 冲 
突 。 因 此 ， 提 交 请 求 被 拒绝 。 特别 地 ， 乐 观 算法 对 存在 热点 (hotspot) 的 数据 库 是 不 合适 的 ， 
因为 数据 项 会 被 可 能 产生 冲突 的 多 个 事务 频繁 地 访问 。 

并 发 控制 通常 以 这 两 类 交互 选择 为 特征 ， 最 常见 的 并 发 控制 是 立即 更 新 的 翡 观 系统 ， 在 
这 里 我 们 会 予以 详细 的 阐述 。 我 们 也 会 对 延迟 更 新 的 乐观 系统 作 简短 描述 ， 因 为 它 在 一 些 情 
况 下 是 非常 有 用 的 。 我 们 不 对 延迟 更 新 的 翡 观 系统 进行 讨论 。 


23.4 立即 更 新 的 悲观 并 发 控制 策略 


我 们 要 求 并 发 控制 是 严格 的 。 决 不 允许 事务 读 或 写 数据 库 中 被 另外 一 个 仍 处 在 活动 状态 
的 事务 写 过 的 数据 项 。 我 们 认为 这 一 限制 能 有 效 地 确保 可 恢复 性 、 防 止 级 联 蜡 常 中 止 以 及 有 
效 地 回 退 。 在 这 一 节 ， 我 们 对 与 立即 更 新 悲观 系统 相关 的 其 他 难点 进行 讨论 ， 并 提出 解决 的 
办 法 。 


23.4.1 避免 冲突 


假设 事务 Tz 已 对 x 写 人 新 值 ， 在 Tz 仍 处 于 活动 状态 时 ， 事 务 Ti 发 出 一 个 冲突 请 求 〈( 如 请 求 
读 x 的 值 )。 我 们 看 到 ， 为 确保 严格 性 ， 这 样 的 请 求 是 不 被 批准 的 ， 但 让 我 们 在 这 时 忽略 严格 
性 ， 而 只 考虑 可 串 行 化 要 求 。 因 为 我 们 假设 在 立即 更 新 系统 中 ， 如 果 T 的 读 请 求 被 批准 ， 将 
返回 T 写 入 的 值 。 因 此 ， 如 果 并 发 控制 批准 这 个 请 求 ， 那 么 任何 串 行 序列 中 ，T: 必 须 在 T: 之 
后 。 如 果 后 来 T, 和 Ts 要 求 访问 另 一 个 数据 y， 那 么 并 发 控制 必须 记 住 它们 之 间 已 存在 的 顺序 ， 
确保 对 y 的 访问 不 与 这 一 顺序 矛盾 。 因 此 ， 如 果 T1 和 Tz 对 y 的 访问 使 得 T2 必 须 跟 在 T 之 后 ， 那 么 
这 两 个 矛盾 的 序列 就 不 可 能 使 任意 一 个 串 行 序列 与 最 终 的 结果 调度 等 价 。 

以 上 问题 还 可 能 有 更 严重 的 危害 。 假 设 T 访 问 x 后 ， 对 y 写 入 一 个 新 值 ， 然 后 T, 提 交 ， 最 后 
T: 请 求 读 y 的 值 ， 如 图 23-10 所 示 。 并 发 控制 不 能 批准 读 操作 ， 因 为 结果 调度 不 是 可 串 行 化 的 。 
因为 T 不 能 完成 ， 它 必须 异常 中 止 ， 但 这 太 不 可 思议 ， 因 为 Ti 读 T 写 的 数据 ，Ti 不 可 能 异常 中 
止 ( 它 已 经 提交 )。 


Tr: r(x) wo) 提交 
Tx wo request_r(y) 


图 23-10 说 明 如 果 要 保持 可 串 行 性 ， 活 动 事务 的 冲突 请 求 不 被 批准 的 调度 


这 个 问题 可 以 通过 延迟 Ti 的 提交 来 避免 ， 但 这 只 会 导致 级 联 异 常 中 止 。 为 避免 这 个 问题 
又 能 确保 可 串 行 性 ， 我 们 要 求 并 发 控制 遵守 下 列 规则 : 


并 发 控制 以 下 列 方式 来 批准 一 个 请 求 ， 它 不 规定 活动 事务 的 顺序 。 
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T: w(x) rly) ”提交 
To: r(x) request_w(y) 


图 23-11 说 明 如 果 要 保持 可 串 行 性 ， 活 动 事务 的 冲突 请 求 不 被 批准 的 调度 


为 实行 这 一 规则 ， 如 果 控 制 已 批准 一 个 仍 处 在 活动 状态 的 事务 的 冲突 请 求 ， 控 制 不 批准 
其 他 事务 的 请 求 。 在 这 个 例子 中 ,TT 的 读 x 请 求 被 延迟 ， 直 到 T, 不 再 处 于 活动 状态 为 止 。 记 
住 ， 因 为 事务 是 顺序 执行 的 程序 ， 所 以 延迟 请 求实 际 上 是 延迟 整个 事务 。 这 种 情况 下 产生 的 
调度 是 

w2(x)r2(y)commit, r;(x)w,(y)commit, 

这 里 每 一 个 操作 下 角 的 字母 表示 执行 这 个 操作 的 事务 。 

注意 ， 这 个 规则 仅 排除 脏 数 据 的 读 取 ， 如 图 23-10 所 示 。 任 何 与 前 一 个 仍 处 在 活动 状态 事 
务 的 请 求 冲突 的 请 求 将 被 延迟 ， 所 以 图 23-11 所 示 的 调度 ， 从 规则 的 角度 来 看 ， 它 和 图 23-10 


的 问题 一 样 。 
如 果 Ti 和 T, 的 请 求 不 冲突 ， 那 么 它们 都 将 被 批准 。 如 果 下 列 条 件 之 -为 真 ， 请 求 就 不 会 
冲突 : . 
1) 请 求 操作 不 同 数据 。 Oo O| a 
2) 两 个 请 求 都 是 读 操作 请 求 。 5 


图 23-12 以 表格 的 形式 显示 冲突 关系 。 

需要 说 明 的 是 ， 基 于 冲突 的 并 发 控制 所 产生 
的 调度 既是 严格 的 ， 又 是 可 串 行 化 的 。 下 面 的 定 图 23-12 立即 更 新 的 翡 观 并 发 控制 冲突 表 ， 

理 陈 述 这 个 结论 : x 表示 锁 模 式 之 间 的 冲突 

定理 ( 品行 提交 顺序 ): 如 果 并 发 控制 已 经 
批准 一 个 仍 处 在 活动 状态 的 事务 的 冲突 请 求 ， 且 不 批准 其 他 事务 的 请 求 ， 那 么 它 产生 的 调度 
是 严格 的 ， 并 且 事 务 的 提交 顺序 是 可 囊 行 化 的 〈 称 为 提交 顺序 (commit order) )。 

显然 ， 这 样 的 并 发 控制 所 产生 的 调度 都 是 严格 的 ， 因为 没有 事务 能 够 读 或 者 写 由 另 一 个 
仍 处 在 活动 状态 的 事务 写 人 的 数据 。 难 点 在 于 ,证 明 提 交 顺 序 的 可 串 行 化 。 首 先 我 们 必须 处 
理 这 样 的 事实 ， 即 调度 可 能 包含 还 没有 完成 的 事务 的 操作 (在 前 面 ， 我 们 的 讨论 限制 在 已 完 
成 事务 所 产生 的 调度 )。 当 我 们 说 一 个 调度 是 可 串 行 化 的 时 候 ， 意 味 着 它 和 符合 以 下 条 件 的 调 
度 是 等 价 的 ， 即 在 这 个 调度 中 ， 已 提交 事务 的 操作 是 不 能 交叉 执行 的 ， 它 发 生 在 未 提交 事务 
之 前 。 以 后 ， 我 们 的 串 行 调度 的 概念 中 包含 这 样 的 调度 。 

可 用 归纳 法 来 证 明 这 一 结果 ， 归 纳 法 是 基于 数字 i ( 它 是 调度 中 已 提交 的 事务 数 ) 来 完成 
的 。 考 虚 最 基本 的 情况 ，i=1， 表 示 仅 有 一 个 事务 Tl 已 提交 ， 共 他 事务 都 处 在 活动 状态 。 这 时 ， 
调度 有 下 列 形式 : pre-commit、commit1、post-commit。 这 里 ，commit! 是 T 的 提交 操作 ，pre- 
commit 是 发 生 在 commit' 操 作 之 前 的 操作 序列 (所 有 事务 的 )，post-commit 是 发 生 在 commiti 之 
后 的 所 有 操作 。pre-commit 和 post-commit 都 不 包含 任何 提交 操作 。 因 为 在 commit, 之 前 所 有 的 
事务 都 处 在 活动 状态 ， 所 以 它 遵 从 我 们 关于 并 发 控制 的 假设 ， 即 pre-commit 中 的 请 求 不 和 调度 
中 的 其 他 请 求 相 冲 突 。 因 此 ，pre-commit 中 所 有 的 操作 是 可 互 换 的 。 特 别 地 ，T, 的 操作 (所 有 
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在 pre-commair 中 的 操作 ) 可 以 和 其 他 事务 的 所 有 操作 互 换 来 产生 一 个 等 价 的 串 行 调度 。 

现在 假设 所 有 恰好 含有 ;个 提交 事务 的 调度 在 提交 顺序 上 是 可 串 行 化 的 。 考 虑 一 个 调度 $， 
它 含 有 i+1 个 已 提交 事务 ， 设 T 是 最 后 一 个 提交 的 事务 ， 且 设 S=S1 : S:， 这 里 S 是 到 IT 的 提交 操 
E (但 不 包括 T) S 的 前 级， 因此 Si 包含 个 已 提交 事务 。 从 假设 可 知 ， 它 在 提交 顺序 上 是 可 串 
行 化 的 。 设 Si “是 等 价 于 Si 的 可 串 行 化 调度 ， 因 此 ，S 等 价 于 调度 S”“' Sz。 调 度 有 如 下 的 性 质 ， 
即 T 的 所 有 操作 都 在 第 i 个 提交 操作 之 后 完成 。 而 且 ，T 的 所 有 操作 必须 能 与 5 中 未 提交 事务 的 
所 有 操作 互 换 ， 所 以 T 的 操作 能 采取 下 列 方式 进行 交换 ， 即 这 些 操作 在 所 有 已 提交 事务 之 后 ， 
未 提交 事务 之 前 。 再 强调 一 次 ， 每 对 交换 使 结果 调度 是 串 行 的 ， 与 S 也 是 等 价 的 。 

因为 那些 仅 访问 不 相交 数据 项 的 事务 可 以 以 任意 的 顺序 排列 ， 所 以 一 个 可 串 行 化 的 调度 
能 和 不 止 一 个 串 行 调 度 等 价 ， 但 正如 我 们 以 上 所 述 ， 其 中 的 一 个 串 行 顺序 是 提交 顺序 。 

尽管 我 们 要 求 的 是 调度 按照 某 种 顺序 可 串 行 化 ， 但 用 户 可 能 希望 事务 按 提交 顺序 执行 。 
例如 ， 事 务 经 常 有 一 些 外 部 操作 对 用 户 来 说 是 可 见 的 〈 一 个 存款 事务 输出 一 个 收据 )， 用 户 希 
望 等 价 的 串 行 顺序 与 这 些 动作 一 致 。 因 此 ， 用 户 在 观察 到 Ti 的 外 部 动作 后 启动 T:， 他 和 希望 一 
个 等 价 的 串 行 顺序 ， 其 中 Tz 在 Ti 之 后 执行 (收据 打印 好 后 ， 启 动 一 个 取款 事务 应 该 能 看 到 数 
据 库 中 存款 的 结果 )。 为 确保 这 些 外 部 动作 与 等 价 的 串 行 序列 相同 ， 一 个 办 法 就 是 按 提交 顺序 
将 其 串 行 化 。 并 发 控制 通常 按 提交 顺序 串 行 化 事务 。 


23.4.2 死 锁 


当 事 务 发 出 的 请 求 与 另 一 个 活动 事务 执行 的 操作 冲突 时 ， 串 行 性 要 求 此 时 不 批准 这 个 请 
求 。 发 出 请 求 的 事务 会 一 直 等 待 ， 直 到 冲突 消失 (因为 其 他 事务 提交 或 异常 中 止 ) 为 止 ， 但 
这 会 导致 死 锁 的 发 生 ， 如 图 23-13 所 示 。 当 Ti 请 求 读 ? 时 ， 系 统 要 求 它 等 待 〈 直 到 T 提 交 或 异常 
中 止 为 止 )， 当 后 来 T: 请 求 读 z 时 ， 系 统 也 要 求 它 等 待 (直到 Ti 提交 或 异常 中 止 为 止 )。 如 果 不 
采取 措施 ， 这 两 个 事务 都 将 永远 等 待 ， 这 是 我 们 非常 不 愿意 看 到 的 情况 。 


T: w(x) request_r(y) 
Tz: w(y) request_r(x) 


图 23-13 说 明 死 锁 的 调度 


更 一 般 地 ， 当 有 事务 相互 等 待 的 环 时 ， 我 们 就 说 存在 死 锁 (dead lock). 

使 事务 等 待 的 并 发 控制 必须 提供 一 些 机 制 来 处 理 死 锁 。 常 见 的 办 法 就 是 构建 一 个 数据 结 
构 来 表示 等 待 (waits_for) 关系 : WẸ (Ti, T) 是 一 个 waits_for 元 素 ， 它 表示 T 在 等 待 T。 
当 冲 突 被 检测 到 时 ， 就 能 创建 waits_for。 如 果 T, 的 请 求 与 另 一 个 已 得 到 批准 的 活动 事务 T: 的 操 
EHR, 那么 (Ti, T2) 就 被 插入 到 waits_for 中 。 类 似 地 ， 如 果 T: 正 在 等 待 T:， 那 么 〈T.:， 
T;) 就 被 插入 到 waits_for 中 ， 这 个 过 程 一直 继 续 下 去 ， 直 到 又 回 到 它 自身 为 止 ， 因 而 就 检测 
到 一 个 死 锁 ， 或 者 在 一 个 不 是 处 于 等 待 状态 的 事务 那里 终止 。 如 果 人 允许 Ti 等 待 会 导致 死 锁 发 
” 生 ， 那 么 并 发 控制 就 异常 中 止 ， 然 后 重新 启动 环 中 的 某 个 事务 (通常 是 T1)。 异 常 中 止 对 启动 
这 个 异常 中 止 事 务 的 用 户 来 说 是 不 可 见 的 。 

第 二 个 处 理 死 锁 的 机 制 是 超时 (time out)。 如 果 事 务 等 待 执行 一 个 操作 的 时 间 超 过 某国 
值 ， 控 制 就 认为 发 生死 锁 。 结 果 ， 它 会 异常 中 止 这 个 事务 或 者 重新 启动 这 个 事务 。 
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最 后 ， 时 间 惟 技术 [Rosenkrantz et al. 1978] 能 用 来 防止 死 锁 的 发 生 〈 与 死 锁 检测 相对 应 )。 
并 发 控制 使 用 当前 的 时 钟 值 在 一 个 事务 启动 时 作为 事务 的 时 间 惟 。 假 设 时 钟 比 事务 启动 的 频率 
向 前 走 的 更 快 ， 每 个 事务 的 时 间 惟 是 唯一 的 。 如 果 发 生 冲 突 ， 并 发 控制 就 使 用 两 个 事务 的 时 间 
戳 来 决定 是 等 待 还 是 重新 启动 。 例 如 ， 它 可 能 采取 年 长 的 事务 不 等 待 年 轻 事 务 的 策略 (通过 蜡 
常 中 止 年 轻 事务 来 实现 )。 如 果 一 个 事务 在 因 死 锁 而 导致 的 异常 中 止 后 重启 ， 它 将 维持 其 原 有 
的 时 间 惟 。 这 样 ， 控 制 就 能 确保 事务 最 终 得 以 完成 ， 因 为 它 最 终 会 变 成 最 年 长 的 事务 。 


23.5 立即 更 新 的 悲观 并 发 控制 的 设计 


实现 立即 更 新 的 悲观 并 发 控制 的 标准 技术 称 为 加 锁 (locking )。 当 事务 请 求 对 数据 库 某 特 
定数 据 项 执行 操作 时 ， 系 统 试图 为 这 个 事务 在 这 个 数据 上 获得 一 个 适当 的 锁 。 例 如 ， 对 于 读 
操作 ， 它 就 试图 获得 读 锁 (read lock)， 对 于 写 操作 ， 它 就 试图 获得 写 锁 (write lock). RK 
得 锁 之 前 ， 事 务 不 能 对 数据 进行 操作 。 写 锁 比 读 锁 的 要 求 更 加 严格 ， 因 为 一 旦 事务 对 数据 加 
写 锁 ， 它 就 既 能 对 数据 进行 读 操 作 ， 又 能 对 数据 进行 写 操作 。 

基于 我 们 以 前 的 讨论 ， 我 们 可 以 得 出 以 下 结论 : 

。 并 发 控制 仅 在 没有 其 他 活动 事务 对 数据 施加 写 锁 时 允许 事务 对 特定 数据 加 读 锁 。 因 为 即 

使 其 他 事务 也 对 这 个 数据 施加 了 读 锁 ， 事 务 仍 可 以 对 这 个 事务 加 读 锁 ， 所 以 读 锁 常 被 称 

为 共享 锁 (shared lock). 

。 并 发 控制 只 有 在 没有 其 他 活动 事务 对 这 个 数据 施加 读 锁 或 写 锁 时 允许 事务 对 特定 数据 加 

写 锁 。 因 此 ， 写 锁 常 被 称 为 排他 锁 (exclusive lock). 


23.5.1 锁 集 和 等 待 集 的 实现 


为 实现 加 锁 ， 我 们 假设 与 并 发 控制 相关 联 的 每 个 已 加 锁 的 数据 项 x 相关 数据 结构 称 为 锁 集 
(lock set) L(x)， 它 描述 并 发 的 活动 事务 在 x 上 加 的 锁 。 在 以 上 的 规则 中 ， 若 L(x) 非 室 ， 则 它 可 
以 包含 描述 在 数据 x 上 的 读 锁 的 多 个 项 或 描述 x 上 一 个 写 锁 的 数据 项 。 

类 似 地 ， 我 们 把 与 每 个 已 加 锁 的 数据 项 x 相关 的 数据 结构 称 为 等 待 集 (wait set) W(x), € 
表示 有 事务 对 数据 库 中 的 x 发 出 操作 请 求 ， 但 还 没有 获得 锁 。 因 为 在 一 个 数据 库 中 通常 存储 大 
量 的 数据 ， 保 持 锁 和 对 那些 没有 被 引用 的 等 待 集会 使 效率 低下 。 因此， 这 些 集合 通常 是 在 它 
第 一 次 引用 时 动态 分 配 的 ， 处 理 锁 的 总 开销 包括 管理 存储 的 时 间 和 存储 集合 中 各 项 的 空间 。 

最 后 ， 我 们 把 与 每 个 活动 事务 Ti 相关 的 数据 结构 称 为 一 个 锁 列 表 (lock list) Li， 它 是 所 
有 已 获得 锁 和 其 他 数据 等 待 集中 的 事务 项 的 列表 ， 注意，T 的 锁 列 表 可 能 最 多 有 等 待 集中 的 
一 个 事务 ， 因 为 一 旦 事务 的 请 求 被 放 入 到 等 待 集中 ， 事 务 就 被 挂 起 ， 直 到 请 求 从 等 待 集中 删 
除 ， 事务 才 会 被 恢复 。 

Ti 访 问 x 的 请 求 可 以 被 当 作 是 检查 和 批准 锁 的 并 发 控制 中 的 例 程 的 调用 。 例 程 通 过 执行 下 
BERT L (x). W(x) FIL EFT BRE: 

1) 如 果 T 已 经 获得 对 x 的 读 锁 ， 读 请 求 就 被 批准 。 如 果 Ti 已 经 获得 对 x 的 写 锁 ， 读 写 请 求 都 
被 批准 。 

2) 如 果 T; 还 没有 被 批准 对 x 加 合适 的 锁 ， 就 搜索 L(x) 和 W(x)， 寻 找 与 请 求 访问 冲突 的 事务 。 
例如 ， 如 果 T 请 求 读 x+， 一 个 冲突 项 可 能 是 Ti 四) 的 写 锁 ， 或 者 是 Tj 已 经 发 出 的 对 x 的 写 请 求 ， 
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该 写 请 求 悬挂 在 W(O 中 。 如 果 这 里 没有 冲突 项 ， 就 批准 T 的 请 求 ， 在 LCO 和 Li 中 插 和 项， 说 明 
Ti 和 所 需 的 锁 类 型 ， 恢 复工 ， 我 们 说 Ti 对 x 加 镇。 

如 果 在 L(Co) 中 存在 冲突 项 ， 就 延迟 请 求 ， 将 Ti 和 请 求 的 锁 类 型 揪 入 到 Wo 和 Li 中 ， 阻 塞 T。 
类 似 地 ， 如 果 在 W(x) 中 有 一 个 冲突 项 ， 那 么 以 同样 的 方法 延迟 请 求 。 在 后 面 的 这 种 情形 下 ， 
通常 T 会 等 待 ， 以 避免 使 另 一 个 正在 等 待 对 x 进行 访问 的 事务 T 处 于 一 种 饥饿 (starving) 状态 。 
如 果 在 W(x) 中 的 项 无 限制 地 等 待 ， 就 会 出 现 饥饿 的 情形 ， 这 是 由 于 后 来 的 事务 抢先 得 到 服务 
而 造成 的 。 例 如 ，T 在 等 待 一 个 数据 项 的 写 锁 ， 而 这 个 数据 已 经 被 别 的 事务 加 读 锁 ， 如 果 T 也 
有 一 个 读 请 求 ， 它 就 能 立即 得 到 服务 ， 因 为 它 不 与 已 存在 的 锁 发 生 冲 突 ， 但 如 果 调 度 算法 在 
这 种 情况 下 对 T 的 请 求 置之不理 ， 一 系列 的 读 请 求 就 会 使 T 无 限期 等 待 下 去 ,TT 处 在 一 种 饥饿 
的 状态 ， 我 们 说 这 种 算法 是 不 公平 的 ， 因 此 T; 必 须 等 待 。 

3) 如 采 让 T 等 待 ， 则 可 能 导致 死 锁 。 如 果 T 等 待 (暂时 地 )， 那 么 有 可 能 出 现 这 样 的 一 
种 情形 。 而 Ti 使 用 23.4.2 节 描述 的 waits_jor 关 系 检测 。 如 果 检 测 到 死 锁 ，T, 就 重新 启动 (或 者 
在 这 个 环 中 的 其 他 事务 )。 

4) 当 T 提 交 或 异常 中 止 时 ， 就 使 用 L: 来 定位 和 删除 锁 集 中 T; 所 有 的 项 (因为 Tj; 不 再 处 于 活 
动 状 态 )。 如 果 将 从 LY) 中 删除 一 个 锁 ， 且 W(x) 非 空 ，T; 对 x 的 锁 至 少 与 一 个 正在 等 待 的 请 求 发 
生 冲 突 ， 那 么 该 请 求 就 可 以 被 批准 (如 果 T; 对 x 施加 一 个 读 锁 ， 并 且 还 有 其 他 事务 施加 的 读 锁 ， 
那么 就 不 可 能 批准 W(x) 中 的 一 个 请 求 )。 在 这 里 ， 有 几 种 策略 可 用 来 改进 (promote) W(x) 和 
L(x)。 例 如 ， 一 个 公平 的 策略 是 以 FIFO 〈 先 来 先 服务 ) 的 顺序 检查 W(x) 的 请 求 。 如 果 准 许 一 
个 请 求 ， 就 把 它 移 到 L(x) 中 ， 并 检查 下 一 个 W(x) 请 求 ， 如 果 不 批 准 请 求 、 就 得 检查 更 多 的 请 
求 。 另 外 ， 如 果 列 表 中 的 第 一 个 请 求 是 读 请 求 ， 就 批准 列表 中 所 有 的 读 请 求 。 如 果 列 表 中 的 
第 一 个 请 求 是 写 请 求 ， 就 只 批准 这 一 个 请 求 。 这 是 按 FIFO 顺 序 从 服务 请 求 中 分 离 出 来 的 ， 它 
不 会 导致 饥饿 。 当 推进 过 程 完 成 后 ，L 就 被 删除 。 

并 发 控制 保证 它 批准 的 所 有 调度 都 是 可 串 行 化 的 ， 因 为 它 只 批准 这 样 一 些 请 求 ， 这 些 请 
求 可 与 先前 已 经 批准 给 活动 事务 的 请 求 进行 交换 。 

加 锁 算 法 有 自动 获得 锁 的 性 质 。 事 务 只 要 发 出 访问 数据 项 的 请 求 ， 并 且 当 请 求 被 批准 时 ， 
并 发 控制 会 自动 地 记录 事务 所 获得 的 锁 。 在 事务 完成 前 ， 所 有 的 锁 都 必须 保持 ， 在 事务 执行 
完成 时 ， 控 制 自动 地 释放 对 这 个 事务 所 加 的 锁 ， 因 为 写 锁 是 排他 的 ， 所 以 必须 保持 到 最 后 ， 
自动 加 锁 遵 守 严格 调度 。 


23.5.2 两 段 锁 


一 般 来 说 ， 加 锁 是 自动 完成 的 ， 但 有 些 系统 允许 手动 加 锁 和 解锁 。 在 这 种 情况 之 下 ， 事 
务 在 发 出 另 一 个 访问 请 求 之 前 ， 它 明确 地 向 并 发 控制 发 出 锁 请 求 。 和 以 前 一 样 ， 只 有 并 发 控 
制 确信 请 求 的 事务 当前 可 以 获得 合适 的 锁 时 ， 访问 才 会 被 批准 。 

除 在 事务 终止 时 ， 事 务 持 有 的 所 有 的 锁 会 自动 解除 外 ， 解 锁 也 可 以 手动 完成 。 手 动 解锁 
可 以 有 更 大 的 灵活 性 ， 因 为 和 自动 解锁 相 比 ， 如 果 事务 在 终止 之 前 释放 锁 ， 并 发 事务 就 能 在 
更 早 的 时 候 访 问 数据 。 但 是 ， 为 加 强 严 格 性 ， 事 务 不 能 提前 释放 写 锁 (如 果 是 这 样 ， 其 他 事 
务 就 能 对 这 个 数据 项 加 锁 并 访问 ， 而 这 时 第 一 个 事务 还 处 在 活动 状态 )。 因 此 ， 提 前 释放 仅 限 
于 读 锁 。 
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而且 ， 除 非 能 正确 地 提前 释放 读 锁 ， 否 则 会 导致 不 可 串 行 化 的 调度 。 例 如 ， 考 虑 图 23-14 
所 示 的 调度 。 其 中 ，1(Co) 是 对 x 的 加 锁 请 求 ，u(z) 是 对 x 的 解锁 请 求 。Ti 读 zx， 解 锁 ， 然 后 读 y。 
在 这 两 个 访问 之 间 ，T2: 对 这 两 个 数据 项 作 冲 突 访问 。 调 度 不 是 可 串 行 化 的 ， 因 为 每 个 事务 必 
须 以 串 行 的 顺序 跟 在 另 一 个 事务 之 后 。 如 果 锁 是 由 并 发 控制 来 自动 处 理 的 ， 这 种 情形 就 不 会 
发 生 ， 因 为 锁 必 须 一 直 保 持 到 提交 时 才能 释放 。 下 面 我 们 说 明 在 手动 系统 中 ， 通 过 要 求 事务 
在 释放 锁 之 后 ， 不 能 再 对 数据 加 锁 就 可 以 避免 这 种 情况 。 


K(x) r(x) u(x) ly) ry) uO) 
Ta: I) 10) 1) wh) ro) wh) uO) ut) 


图 23-14 涉及 不 是 两 段 锁 事务 的 不 可 串 行 化 调度 


如 果 一 个 事务 在 解锁 之 前 ， 保 持 所 有 的 锁 (首先 是 加 锁 阶 段 ， 然 后 是 解锁 阶段 )， 则 该 事 
务 被 说 成 保持 两 段 锁 协 议 《two- “Phase locking) [Eswaran et al.1976]。 图 23-14 的 调度 不 是 两 阶 
段 。 自 动 加 锁 是 两 阶段 。 

定理 (两 段 锁 ): 使 用 两 段 锁 协议 的 并 发 控制 产生 可 串 行 的 调度 。 

在 23.1.3 节 有 使 用 串 行 图 定理 对 这 个 定理 的 证 明 [Ullman 1982]。 当 且 仅 当 调 度 的 串 行 图 无 
环 时 ， 这 个 调度 是 冲 罕 可 串 行 化 的 。 这 是 用 矛盾 法 来 证 明 的， 假设 由 两 段 锁 的 并 发 控制 所 产 
生 的 调度 串 行 图 包含 环 : 

Ti >T:>-->T,>T, 
AT ~T: 表 示 在 调度 中 Ti 有 操作 与 前 面 T: 的 操作 相 冲突 。 因 为 操作 冲突 ， 所 以 在 执行 这 两 个 操 
作 时 ，Ti 必 须 释 放 锁 ，T, 获 得 锁 。T; 和 T; 的 情况 类 似 ， 所 以 可 以 得 出 这 样 的 结论 ， 在 T, 获 得 锁 
之 前 ，T 释 放 锁 。 因 此 ，T' 释 放 一 个 锁 之 后 又 获得 一 个 锁 ， 这 违反 了 两 段 锁 协议 。 因 此 ， 我 
们 得 出 矛盾 ， 这 样 就 得 出 结论 ， 由 一 个 两 段 锁 并 发 控制 所 产生 的 串 行 图 的 所 有 调度 必定 是 无 
环 的 ， 因 而 是 可 串 行 化 的 。 

在 使 用 两 段 锁 协 议 时 ， 一 个 可 能 的 等 价 串 行 顺 序 是 事务 各 自 执行 第 一 个 释放 锁 的 顺序 
(在 练习 23.8 中 要 求证 明 这 一 结论 )。 因 此 ， 如 果 调 度 包含 事务 T, 和 T,，T 的 第 一 个 解锁 请 求 发 
生 在 T; 的 第 一 个 解锁 请 求 之 前 ， 则 在 一 个 等 价 的 串 行 顺序 中 ，T, 就 先 于 T,。 如 果 事 务 将 锁 一 
直 保 持 到 提交 时 ， 那 么 串 行 顺 序 就 是 提交 顺序 。 

两 段 式 并 发 控制 将 锁 保持 到 提交 时 (例如 ， 自 动 加 锁 ) ， 那 么 说 它 是 满足 严格 的 两 段 锁 协 
iM (strict two-phase locking protocol)。 严 格 的 两 段 镇 协议 的 定义 比 严格 的 并 发 控制 的 定义 更 
加 严格 ， 因 为 后 者 要 求 控制 保持 “ 写 锁 ” 到 提交 时 刻 ， 但 欧 许 “ 读 锁 ”提前 释放 (但 仍 处 在 
一 个 两 阶段 行为 中 )。 

因为 等 价 的 串 行 顺 序 是 在 运行 时 确定 的 , 所 以 两 段 锁 也 称 作 动 态 协 议 (dynamic protocol), 
它 和 静态 协议 (static protocol) 相反 。 在 静态 协议 中 ， 顺 序 是 由 事务 的 启动 顺序 来 决定 的 。 
23.8.1 节 所 讨论 的 时 间或 顺序 的 并 发 控制 是 一 个 静态 协议 。 


23.5.3 锁 的 粒度 
我 们 把 被 加 锁 的 实体 称 作 数据 项 ， 但 并 没有 解释 它 是 什么 样 的 数据 项 。 现 在 我 们 把 数据 
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库 中 被 并 发 控制 算法 加 锁 的 数据 项 定义 成 任意 的 一 个 实体 ， 它 可 以 是 变量 、 记 录 、 行 、 表 、 
文件 等 。 在 本 章 中 ， 所 有 的 算法 都 假设 ， 一 个 数据 项 有 唯一 标识 它 的 名 字 (在 第 24 章 ， 我 们 
将 看 到 情况 并 不 总 是 这 样 )。 这 个 名 字 用 来 在 访问 数据 项 的 时 候 引 用 这 个 数据 项 。 数 据 项 的 锁 
集 和 等 待 集 经 常 按 它 的 名 字 散 列 定位 。 

被 锁定 的 实体 大 小 决定 锁 的 粒度 (granularity ) 。 实 体 越 小 ， 则 锁 的 粒度 越 细 (fine )， 否 
则 越 粗 (coarse)。 锁 的 粒度 越 粗 ， 则 加 锁 的 算法 越 保守 。 因 此 ， 在 数据 库 管 理 系 统 中 ， 只 支 
持 表 的 锁 ， 当 访问 一 行 时 ， 会 将 整个 表 锁 定 。 显 然 ， 串 行 化 没有 受到 锁 粒 度 的 影响 。 因 为 只 
要 被 访问 的 数据 项 被 锁定 ， 两 段 锁 并 发 控制 就 能 产生 串 行 化 的 调度 ， 即 使 锁定 了 其 他 不 需要 
锁定 的 数据 项 。 细 粒度 的 锁 可 以 使 事务 的 并 发 程度 更 高 ， 因 为 事务 只 需 对 它 实 际 要 访问 的 数 
据 项 加 锁 。 不 过 ， 与 细 粒 度 加 锁 相 关 的 开销 会 更 大 。 通 常事 务 要 保持 的 锁 越 多 ， 就 要 有 更 多 
的 空间 来 保存 锁 的 信息 。 当 在 相同 的 锁定 了 的 实体 内 ， 事 务 要 访问 多 个 数据 项 时 ， 粗 粒度 的 
锁 可 以 解决 这 些 问 题 。 例 如 ， 一 个 事务 可 能 访问 一 个 表 的 多 行 ， 只 要 对 这 个 表 加 锁 就 可 以 。 

许多 系统 实现 页 锁 作 为 一 种 折 中 ， 即 对 存储 数据 项 的 页 面 加 锁 ， 而 不 是 对 数据 项 本 身 加 
锁 。 页 地 址 是 被 锁定 的 实体 名 。 页 锁 是 保守 的 ， 因 为 不 仅 要 给 需 访 问 的 数据 项 加 锁 ， 还 要 给 
存储 在 该 页 上 的 其 他 数据 项 也 加 锁 。 


23.6 对 象 和 语义 交换 * 


立即 更 新 的 悲观 并 发 控制 设计 是 基于 数据 库 操作 的 交换 性 的 。 在 简单 系统 中 ， 我 们 已 经 
讨论 过 ， 只 有 读 和 写 操 作 ， 对 特定 的 数据 项 而 言 ， 只 有 两 个 读 操作 是 可 以 交换 的 。 

如 果 我 们 想 要 执行 更 加 复杂 的 数据 库 操作 ， 且 保证 每 个 复杂 操作 的 执行 与 其 他 复杂 操作 
的 执行 相隔 离 ， 我 们 就 可 以 使 用 这 些 操 作 的 语义 来 决定 哪些 操作 可 以 交换 ， 使 用 这 些 信息 来 
设计 并 发 控制 。 在 本 节 中 ， 我 们 讨论 对 象 数据 库 (第 16 章 )， 这 里 的 操作 是 在 对 象 上 定义 的 方 
法 ， 这 些 对 象 存储 在 数据 库 中 。 

作为 对 象 数据 库 的 例子 ， 考 虑 一 个 银行 的 应 用 ， 其 中 一 个 账户 对 象 有 deposit(x) 和 
withdraw(x) 操 作 。 我 们 假设 账户 余额 不 能 为 负 ， 因 此 ， 当 账户 上 至 少 还 有 x 元 时 ，withdraw(x) 
就 会 返回 一 个 OK 值 ， 取 款 操作 成 功 。 如 果 账 户 上 的 余额 低 于 x 元 ， 就 会 返回 一 个 NO 值 ， 取 款 
操作 不 成 功 。 

这 两 个 操作 的 实现 都 涉及 对 数据 库 的 读 操作 (获得 账户 余额 ) 和 写 操 作 (存储 新 的 余额 )。 
因为 并 发 控制 在 非 对 象 数据 库 中 对 读 和 写 的 处 理 是 分 开 的 ， 所 以 它 检 测 读 写 操作 的 冲突 ， 这 
些 读 写 操作 是 不 同事 务 对 同一 账户 的 操作 。 但 假设 并 发 控制 能 接受 调用 方法 的 请 求 。 它 就 会 
发 现 两 个 对 同一 账户 的 deposit(O) 操 作 是 可 交换 的 ， 不 管 它们 以 什么 样 的 顺序 执行 ， 它 们 会 返回 
相同 的 信息 ， 数 据 库 的 最 终 状 态 也 是 相同 的 (账户 中 增加 两 次 存款 的 值 )。 我 们 的 分 析 错 在 哪 
EE? 为 什么 更 高 级 别 操 作 的 交换 性 明显 而 低级 别 操作 的 交换 性 却 不 是 呢 ? 

答案 在 于 ， 在 决定 两 个 存款 操作 是 否 可 交换 时 ， 我 们 抽取 的 是 算法 信息 : 存款 语义 。 但 
读 和 写 几 乎 没有 包含 语义 信息 : 我 们 不 知道 在 事务 计算 中 是 如 何 读 信息 的 ， 我 们 也 不 知道 读 
信息 和 写 信息 之 间 的 联系 。 而 且 ， 低 级 别 存款 的 读 写 操作 是 单独 的 操作 ， 我 们 不 能 保证 其 他 
事务 的 操作 没有 插入 到 这 两 个 操作 之 间 。 





教训 在 于 ， 在 更 高 级 别 的 操作 上 ， 获 取 的 操作 语义 信息 越 多 ， 并 发 控制 就 能 识别 更 多 的 
可 交换 性 。 于 是 ， 我 们 可 以 总 结 出 ， 一 个 大 型 交叉 调度 集 和 串 行 调度 是 等 价 的 ， 而 且 需 要 
的 重新 排序 很 少 。 因 为 重新 排序 涉及 延迟 ， 操 作 语 义 的 使 用 能 提供 更 多 的 并 发 性 ， 并 改善 
性 能 。 

两 个 存款 操作 是 可 以 交换 的 ， 但 对 同一 账 
户 的 deposit(y) 和 withdraw(x) 操 作 却 是 冲突 的 。 
因为 如 果 withdraw0O 在 deposit0) 之 后 执行 ， 可 能 - 
执行 ， 则 可 能 返回 NO 值 (例如 ， 在 操作 执行 
之 前 ， 如 果 余额 是 x-y 元 )。 所 以 我 们 可 以 构造 图 23-15 账户 对 象 上 的 冲突 表 。 

一 个 图 23-15 所 示 的 冲突 表 ， 使 用 这 张 表 来 作 FNAL RISER 

并 发 控制 设计 的 基础 。 表 中 的 行 和 列 对 应 于 数据 库 中 的 操作 ， 对 每 个 这 样 的 操作 ， 都 有 相应 
的 锁 来 控制 。 例 如 ， 当 事务 想 在 一 些 账户 上 调用 deposit0 时 ， 它 就 请 求 一 个 该 账户 对 象 上 的 存 
款 锁 。 如 果 在 这 个 对 象 上 没有 其 他 事务 的 取款 锁 ， 则 请 求 就 被 批准 ， 否 则 ， 事 务 就 必须 等 待 。 
注意 ， 与 基于 读 写 操作 的 控制 来 说 ， 这 种 控制 能 获得 更 强 的 并 发 性 。 因 为 前 者 不 允许 并 发 事 
务 对 同一 对 象 执行 存款 操作 ， 而 基于 图 23-15 的 控制 却 可 以 执行 。 

如 果 我 们 把 另外 的 两 个 概念 运用 到 并 发 控制 设计 中 ， 就 能 获得 更 多 的 并 发 性 。 

部 分 操作 和 向 后 交换 

根据 数据 库 的 初始 状态 ， 我 们 可 以 将 一 个 能 产生 几 个 可 能 结果 的 操作 用 其 他 儿 个 操作 来 
代替 。 例 如 ， 我 们 能 用 以 下 两 个 操作 替换 withdraw(x): 

e withdrawOK(x): 它 在 账户 对 象 的 余额 大 于 或 等 于 x 元 时 执行 。 

* withdrawNO(x): 它 在 账户 对 象 的 余额 小 于 x 元 时 执行 。 

我 们 假设 ， 当 事务 提交 执行 取款 操作 的 请 求 时 ， 并 发 控制 检查 账户 中 的 余额 ， 决 定 是 执 
行 withdrawOKO 还 是 执行 withdrawNO()。 这 些 新 的 操作 称 为 部 分 操作 (partial operation), 
为 每 个 操作 的 定义 只 是 针对 初始 状态 的 一 个 子 集 (为 所 有 状态 定义 的 操作 称 为 全 部 操作 
(total operation ) ) 。 

我 们 可 以 为 部 分 操作 定义 新 的 交换 一 一 向 后 交换 (backward commutativity ) ， 并 使 并 发 控 
制 设计 基于 这 些 新 的 定义 ， 考 虑 下 面 的 操作 序列 : 


withdrawOK,(x), deposit,(y) 


这 个 操作 仅 在 余额 < 至 少 是 x 元 的 情况 下 定义 。 在 所 有 的 状态 中 ， 可 以 定义 操作 序列 







授权 模式 









deposit,(y), withdraw0K, (x) 


因为 在 存款 操作 之 后 ， 余 额 是 z+y， 这 肯定 比 x 要 大 (因此 定义 withdrawOKO )。 而 且 ， 对 这 两 
个 序列 而 言 ， 数 据 库 的 最 终 状 态 是 一 样 的 : 余额 是 z-x+y。 我 们 说 deposit(O) 向 后 与 ， 
withdrawOK(O 交 换 。 . 

更 确切 地 说 ， 如 果 在 所 有 的 数据 库 状 态 中 ， 定 义 操作 序列 qg、p 和 操作 序列 p、q。 操 作 
序列 p 和 q 返 回 同样 的 结果 ， 数 据 库 最 终 的 状态 相同 ， 那 么 就 说 操作 p 与 操作 q 向 后 交换 
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(backward-commute) [Weihl 1988] 。 如 果 p 不 能 向 后 与 交换， 就 说 它 与 4 冲突 (conflict) ， 
这 个 交换 的 定义 和 在 23.1 节 给 出 的 完全 操作 的 交换 定义 是 不 同 的 。 在 完全 操作 的 交换 定义 
中 ， 两 个 操作 车 满足 以 下 条 件 ， 就 是 可 交换 的 : 它们 从 任意 的 数据 库 状 态 开 始 执行 ， 以 不 
同 操作 序列 完成 等 价 的 动作 。 相 反 ， 操 作 p 向 后 与 操作 gq 交换 的 条 件 是 ， 它 们 从 定义 序列 q， 
Pp 的 任意 数据 库 状 态 开始 执行 ， 以 不 同 顺序 完成 相同 的 动作 。 因 此 ， 新 的 定义 使 用 部 分 操作 

注意 ， 向 后 交换 不 是 对 称 关系 。 对 特定 的 操作 p 和 q，p 可 能 向 后 能 与 交换 ， 但 q 却 不 一 定 
能 向 后 与 p 交 换 。 例 如 ， 我 们 已 经 看 到 ，deposit() 能 向 后 与 withdrawOK() 交 换 ， 但 
withdrawOK() 却 不 能 向 后 与 deposit0) 交 换 ， 因 为 这 里 定义 序列 

deposit,(y), withdraw0K, (x) 

的 状态 与 定义 序列 

withdraw0K,(x), deposit.(y) 

的 状态 不 同 。 但 对 有 些 成 对 的 操作 而 言 ， 向 后 交换 是 对 称 的 〈 例 如 ， 两 个 并 发 的 withdrawOKO ). 

和 完全 操作 上 使 用 的 标准 交换 一 样 ， 并 发 控制 设计 可 以 运用 同样 的 方法 来 使 用 部 分 操作 
上 向 后 交换 的 概念 。 例 如 ， 事 务 在 一 个 账户 对 象 上 有 withdrawOK( 锁 ， 另 外 一 个 事务 在 这 个 
对 象 上 请 求 deposit() 锁 ， 该 请 求 就 能 被 批准 ， 因 为 deposit() 能 向 后 与 withdrawOKO 交 换 。 

更 一 般 地 ， 如 果 事 务 Ti 在 一 全 对象 上 有 一 个 q 锁 ， 另 一 个 事务 T 在 这 个 对 象 上 请 求 一 个 P 
锁 ， 如 果 p 向 后 能 与 q 交 换 ， 则 请 求 被 批准 。 注 意 ， 因 为 T: 的 操作 与 Ti 的 操作 向 后 交换 ， 所 以 
这 两 个 操作 可 能 以 反 序 执行 ， 因 此 控制 不 用 确定 T,/ 和 Ts 之 间 的 顺序 。 

基于 这 个 想法 ， 我 们 把 图 23-15 的 冲突 表 扩 充 为 图 23-16 的 冲突 表 。 在 图 中 插入 一 行 ， 列 表 
示 相 应 行 的 操作 能 与 相应 列 的 操作 向 后 交换 。 表 中 的 x 表示 相应 行 的 操作 不 能 向 后 与 相应 列 


的 操作 交换 。 
Paes | | | | 








withdrawOK!() 


withdrawNo() 











图 23-16 在 一 个 账户 上 使 用 部 分 操作 和 向 后 交换 的 冲突 表 
x 表示 相应 行 的 操作 不 能 与 相应 列 的 操作 向 后 交换 


表 中 少量 的 冲突 表明 ， 使 用 这 张 表 的 并 发 控制 将 允许 其 他 并 发 。 但 获得 这 种 并 发 涉及 额 
外 的 运行 时 开销 。 当 一 个 取款 操作 调用 时 ， 并 发 控制 必须 访问 数据 库 来 确定 账户 余额 ， 这 样 
它 就 知道 是 请 求 一 个 withdrawOKO 锁 还 是 一 个 withdrawNOO 锁 。 当 控制 是 基于 图 23-15 的 表 时 ， 
并 不 会 出 现 额外 的 开销 ， 它 与 完全 操作 (而 不 是 部 分 操作 ) 相关 ， 因 为 完全 操作 可 以 在 所 有 


日 ”概念 foward commutativity 的 定义 参见 练习 23.19。 
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原子 性 、 可 恢复 性 和 补偿 操作 


在 一 个 对 数据 库 的 访问 只 使 用 读 和 写 两 种 操作 的 系统 中 ， 只 有 写 操作 会 改变 数据 库 的 状 
态 。 因 为 写 人 一 个 数据 项 x 与 其 他 在 x 上 的 操作 相 冲 突 ， 一 旦 事务 T 写 x， 在 这 个 操作 提交 之 前 ， 
其 他 事务 不 能 访问 x (假设 是 严格 的 两 段 并 发 控制 )。 因 此 ， 如 果 T 失 败 ， 只 需 将 x 恢复 到 写 之 
前 的 值 即 可 ， 我 们 把 这 个 过 程 称 为 物理 恢复 。 

在 支持 抽象 操作 的 系统 中 ， 异 常 中止 更 加 复杂 ， PAMTE EA (如 两 在 


后 Ti 异常 中 止 。 我 们 不 能 只 将 * 的 值 恢复 到 执行 p 操 作 之 前 的 值 bp 的 操作 结果 都 会 
失 。 我 们 已 在 21.2.4 节 的 多 级 事务 中 讨论 过 这 个 问题 ， 并 总 结 出 补偿 是 撤销 一 个 异常 中 止 事务 
影响 合适 的 办 法 。 对 每 一 个 操作 p， 迪 须 有 一 个 补偿 事务 p-:， 这 样 ， 在 所 有 定义 p 的 数据 库 状 
态 中 ， 也 定义 序列 p" ， 执 行 序列 p-' 会 使 数据 库 回 到 未 修改 状态 。 因 而 ， 如 deposit(xz) 能 补偿 
withdrawOK(x), 

如 果 事 务 Ti 和 T: 分 别 使 用 操作 p 和 9 访问 同 一 个 抽象 数据 xz， 然后 Ti 异常 中 止 ， 那 么 问题 就 
很 复杂 。 假 设 操作 以 p、4q 的 顺序 出 现 ，p 的 补偿 操作 是 p!， 因 此 在 调度 中 的 补偿 结果 是 p，q， 
pP 。 我 们 怎样 才能 确保 在 q 修 改 x* 之 后 ， 执 行 p-! 能 正确 地 撤销 p 的 影响 ”我 们 怎样 才能 确保 定义 
p- 的 数据 库 状 态 是 q 执 行 之 后 的 数据 库 状态 ”幸运 的 是 ， 只 有 当 q 与 p 可 向 后 交换 时 ， 我 们 的 并 
发 控制 可 以 调度 q。 因 此 这 个 调度 是 和 调度 9，p，p-! 等 价 的 。 因 为 p-! 在 这 个 调度 中 定义 ， 所 
以 它 必须 也 在 最 初 的 调度 中 定义 。 这 个 调度 和 gq 等 价 ， 因而 补偿 能 正确 的 工作 。 

我 们 所 讨论 的 这 个 简单 的 例子 是 可 恢复 的 (第 23.2 节 )， 其 中 补偿 能 正确 地 工作 ， 产 生 原 
子 性 。 更 一 般 地 ， 考 虑 一 个 事务 T 和 事务 调度 

Pi，Ppz，…，Pp， (23.1) 
如 果 在 执行 完 某 个 操作 pi 后 ，T 异 常 中 止 ， 有 必要 反 序 执行 pl，pz，.…，p 的 补偿 事务 ， 从 而 撤 
销 异 常 中 止 对 T 的 影响 ， 则 事务 调度 就 是 下 列 情形 : 
Pio P25 > Pis pi, Pity e Pr’ (23.2) 
因此 对 事务 T， 有 7 个 可 能 的 “异常 中 止 ”调度 ， 每 一 个 ; (取决 于 T 异 常 中 止 的 时 间 ) 值 对 应 
一 个 异常 中 止 调度 。 

所 有 这 些 调 度 对 数据 库 都 没有 任何 影响 。 当 我 们 执行 T 时 ， 我 们 不 能 预测 它 的 这 n+1 个 调 
BE ((23.1) 或 (23.2)) 哪 一 个 会 发 生 。 而 调度 中 的 异常 中 止 操作 意味 着 要 完成 一 个 复杂 的 动 
作 ， 涉 及 物理 撤销 一 个 事务 先前 对 数据 库 所 作 的 所 有 变更 ，( 23.2) 明确 地 描述 异常 中 止 操作 
所 应 做 的 工作 ， 因 此 ， 在 调度 中 ， 我 们 不 必定 义 异 常 中 止 操作 。 当 调度 提交 时 ， 事 务 就 异 党 
中 止 ， 我 们 把 这 个 过 程 称 作 逻 辑 回 退 (logical rollback), 

如 果 每 个 异常 中 止 的 事务 对 数据 库 没 有 产生 任何 影响 ， 或 者 对 事务 的 并 发 执行 没有 产生 
任何 影响 ， 则 调度 是 可 恢复 的 。 更 精确 地 说 ， 调 度 S 在 满足 下 列 条 件 时 是 可 恢复 的 ， 如 果 对 S 
中 每 一 个 异常 中 止 的 事务 T 而 言 ，S 和 一 个 删除 所 有 T 的 操作 的 调度 等 价 。 

考虑 一 个 并 发 控制 ， 它 以 下 列 的 方式 来 处 理 补偿 操作 : 
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K 它 不 检查 冲突 就 批准 补偿 操作 。 。 

只 有 当 它 们 可 以 向 后 与 已 经 批准 为 活动 事务 交换 时 ， 它 才 批 准 向 前 操作 (没有 考虑 可 
能 和 先前 已 经 批准 活动 事务 的 补 公 损 作 吉 交 | 

我 们 必须 证 明 ， 这 一 设计 能 正确 地 工作 。 这 样 ， 由 控制 产生 的 任意 调度 就 是 可 恢复 的 ， 
在 恢复 后 ， 疫 有 异常 中 止 的 事务 调度 结果 是 可 串 行 化 的 。 

让 我 们 来 看 任意 的 调度 S， 它 可 能 由 这 样 的 并 发 控制 产生 ， 涉 及 提交 事务 和 异常 中 止 事务 
(因而 即 包含 向 前 操作 ， 也 包含 补偿 操作 )。 考 虑 S 中 的 第 一 个 异常 中 止 事务 ， 在 事务 执行 时 ， 
ip: 是 第 一 个 补偿 操作 。 因 为 p 丫 是 S 中 的 第 一 个 补偿 操作 ， 所 以 S 有 下 列 形式 : 

Sprefix > Po S', pi 7, S sustix 
这 里 ，S' 是 把 pi; 与 p; 分 开 的 一 个 操作 序列 (注意 ，S' 只 包含 向 前 操作 ， 因 为 pi 是 S 中 的 第 一 个 
补偿 操作 )。 因 为 除非 操作 可 向 后 与 p; 交 换 ， 否 则 并 发 控制 不 会 在 S' 中 调度 一 个 操作 ， 所 以 这 
个 调度 是 和 下 列 调度 等 价 的 : 

Sprefixs S's Pis Pi , Ssuffix 
这 个 调度 又 和 调度 

Sprefix» S's, Ssuffix 

等 价 。 

这 一 变换 使 p 和 p” 相互 消除 影响 ， 因 而 使 S 和 一 个 更 加 短 的 调度 等 价 。 

这 一 变换 现在 也 能 用 来 消除 S 中 的 第 二 个 补偿 操作 和 与 之 匹配 的 向 前 操作 。 这 样 进行 下 去 ， 
就 能 从 S 中 消除 异常 中 止 事务 的 所 有 操作 (向 前 的 和 补偿 的 操作 )， 最 终 产生 一 个 没有 异常 中 
止 事 务 的 调度 。 因 此 ，S 是 可 恢复 的 。 而 且 ， 结 果 调度 与 等 价 于 一 个 串 行 调度 冲突 。 这 种 变换 
总 是 可 能 的 事实 就 可 以 证 明 并 发 控制 的 正确 性 。 

通过 这 样 的 变换 ， 一 个 调度 可 以 缩减 成 没有 异常 中 止 事务 的 可 串 行 化 调度 ， 我 们 把 这 个 
调度 称 为 是 可 缩减 的 〈reducible )。 并 发 执行 的 事务 T!,，T,，…，T, 是 可 恢复 的 ， 条 件 是 调度 
(其 中 的 每 个 事务 Tj 可 用 它 的 事务 调度 来 表示 ) 是 可 缩减 的 。 本 节 所 描述 的 所 有 由 并 发 控制 产 
生 的 调度 都 是 可 缩减 的 ， 因 而 也 是 可 恢复 的 2 。 


23.7 ”结构 化 事务 模型 中 的 隔离 


在 第 21 章 中 介绍 了 一 些 事务 模型 。 讨 论 过 串 行 化 和 锁 之 后 ， 现 在 我 们 来 看 如 何在 这 些 模 
型 中 实现 陋 离 。 我 们 将 在 第 26 章 中 讨论 量 训 在 分 布 式 事务 中 的 实现 ， 所 以 在 这 里 我 们 不 对 这 
一 内 容 进行 讨论 。 
23.7.1 存储 点 


存储 点 (参见 21.2.1 节 ) 是 在 事务 T 内 部 实现 部 分 回 退 的 机 制 ， 它 使 事务 的 部 分 操作 对 数 
据 库 所 作 的 更 新 回 退 到 更 新 之 前 。 回 退 完 成 后 ， 恢 复 的 数据 项 可 能 立即 被 解锁 ， 可 供与 其 并 


O ”如 果 由 于 冲突 而 延迟 补偿 操作 ， 死 锁 可 能 导致 不 能 实现 异常 中 止 ， 这 是 无 法 接受 的 。 
© [schek et al. 1993] 中 有 关于 这 一 问题 更 加 详细 的 讨论 。 
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发 的 事务 使 用 。 因 此 在 并 发 控制 中 ， 我 们 有 下 列 基于 锁 的 存储 点 规则 。 

1) 当 创 建 存储 点 S 时 ， 对 任何 锁 集 没有 影响 。 但 并 发 控制 系统 必须 记 住 事务 Ti 在 创建 之 
前 所 有 已 获 的 锁 的 标识 ， 如 果 T; 回 退 到 S， 它 就 能 释放 在 创建 S 后 所 获得 的 锁 。 为 实现 上 述 目 
标 ， 控 制 在 锁 列 表 L; 中 作 标 记 ， 基 中 包含 一 个 代表 存储 点 Id 的 数字 。 这 个 标记 以 后 的 锁 项 对 应 
于 在 创建 之 后 获得 的 锁 。 

2) 当 事 务 回 退 到 S 时 ，Li 中 所 有 处 在 标记 之 后 对 应 于 锁 项 的 锁 被 释放 。 

在 两 段 锁 并 发 控制 中 ， 如 果 上 述 规则 能 保持 隔离 性 ， 那 么 是 比较 好 的 结果 。 事 务 在 产生 
一 个 存储 点 后 可 能 读 一 个 数据 项 =， 然 后 回 退 ， 释 放 这 个 读 锁 。 结 果 是 提前 释放 一 个 读 锁 ， 这 
很 容易 产生 非 两 段 调度 。 为 保持 隔离 性 ， 必 须 修改 第 二 个 规则 ， 以 便 将 写 锁 降 级 为 读 锁 ， 读 
锁 不 被 释放 。 


23.7.2 链 式 事务 


链 用 来 把 一 个 事务 IT 成 分 解 成 更 小 的 子 事务 ， 从 而 在 发 生 崩溃 时 ， 避 免 整个 事务 回 退 。 
在 第 21 章 ， 我 们 讨论 两 个 不 同 的 语义 ， 以 便 说 明 当 控制 从 链 中 的 一 个 子 事务 移 向 另 一 个 子 
事务 时 ， 链 式 事务 是 如 何 处 理事 务 访问 的 数据 库 项 的 状态 的 。 使 用 提交 ， 不 必 保 持 两 个 子 
事务 之 间 的 状态 ， 尽 管 单个 子 事务 是 隔离 的 和 可 串 行 化 的 ， 但 事务 T 作 为 一 个 整体 却 不 是 。 
使 用 链 ， 可 以 在 一 个 子 事务 和 下 一 个 子 事务 之 间 维 持 状 态 ，T 相 对 其 他 事务 而 言 是 隔离 的 和 
可 串 行 化 的 。 

提交 操作 是 按 正常 方式 处 理 的 ， 即 释放 所 有 的 锁 。 对 于 链 操作 来 说 ， 锁 不 被 释放 ， 而 是 
传 给 链 中 的 下 一 个 子 事务 。 在 这 两 种 情况 下 都 可 以 得 到 持久 性 (在 第 25 章 描述 )。 


23.7.3 可 恢复 队列 


可 恢复 队列 能 在 数据 库 内 部 实现 (因为 数据 库 是 持久 的 )， 但 性 能 因此 受 损 。 队 列 是 一 
个 热点 ， 它 被 许多 事务 访问 ， 因 为 并 发 控制 是 严格 的 ， 锁 要 一 直 保 持 到 提交 时 刻 ， 因 而 产生 
瓶颈 。 i 
由 于 这 个 原因 ， 可 恢复 队列 是 作为 一 个 模块 来 实现 的 。 一 种 可 能 的 实现 方式 是 ， 给 队列 
中 的 每 一 个 元 素 、 队 首 指针 、 队 尾 指针 分 别 加 锁 。 事 务 想 将 一 个 元 素 插 入 到 队列 或 删除 出 队 
列 时 ， 它 必须 首先 给 队 尾 指针 和 队 首 指针 分 别 施加 “ 写 锁 ”。 给 指针 加 锁 只 能 保证 入 队 或 出 
队 操 作 的 持久 性 ,而 对 入 队 或 出 队 元 素 施 加 的 锁 会 一 直 保 持 到 提交 时 。 因 此 ， 例 如 事务 T 可 
以 从 队列 中 去 除 一 个 元 素 ， 释 放 队 首 指 针 的 锁 。 另 一 个 事务 可 以 在 T 提 交 或 异常 中 止 之 前 使 
下 一 个 元 素 出 队 。 

注意 ， 因 为 队列 是 作为 与 数据 库 分 开 的 一 个 模块 来 实现 的 ， 所 以 可 消除 严格 性 和 两 段 锁 
要 求 的 限制 。 显 然 ， 并 发 控制 对 指针 的 镇 的 操纵 方式 不 是 严格 的 ， 也 不 必 是 两 段 的 。 队 列 实 | 
质 上 是 具有 已 知 语义 的 对 象 。 队 列 用 于 调度 ， 所 以 定义 在 队列 上 的 操作 是 可 交换 的 一 一 尽管 
实际 并 不 是 这 样 ( 例 如， 如 果 出 队 的 操作 顺序 是 相反 的 ， 那 么 将 返回 不 同 的 信息 给 调用 者 )。 
结果 ， 并 发 程度 的 加 强 是 以 牺牲 隔离 性 为 代价 的 。 并 发 事务 可 能 以 不 同 的 顺序 让 一 个 队列 集 
合 中 的 元 素 人 队 和 出 队 ， 但 在 实现 串 行 执行 时 是 不 能 实现 这 一 点 的 。 

与 在 队 首 和 队 尾 指针 的 锁 对 应 ，T 总 是 对 它 所 访问 的 元 素 施 加 “ 写 锁 * ， 直 到 提交 为 止 。 
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例如 ， 这 能 保证 在 T 插 入 一 个 元 素 以 后 ， 直 到 T 提 交 之 前 ， 没 有 其 他 的 事务 T' 能 使 这 个 元 素 
出 队 。 


23.7.4 EBS 

赂 套 事务 支持 子 事务 的 并 发 执行 ， 也 就 是 说 多 个 高 级 事务 的 子 事务 能 并 发 执行 ， 能 请 求 
冲突 的 数据 库 操作 。 因 此 ， 除 给 并 发 事务 加 锁 的 授权 规则 外 ， 我 们 必须 引入 新 的 规则 ， 用 来 
PSA (RE) 事务 的 子 事务 锁 的 授权 。 

在 第 21 章 讨论 的 嵌 套 事务 模型 遵守 下 列 规则 : 

1) 作为 整体 的 每 个 嵌 套 事务 必须 是 隔离 的 ， 因 而 相对 其 他 和 内 套 事务 而 言 是 可 串 行 化 的 。 

2) 子 事务 的 父 事务 不 与 其 子 事务 并 发 执行 。 

3) 每 个 子 事务 (及 其 所 有 后 代 ) 必须 是 隔离 的 ， 因 而 相对 于 每 个 兄弟 事务 (及 其 所 有 后 
代 ) 是 可 串 行 化 的 。 

为 执行 这 个 语义 ， 我 们 必须 施加 以 下 规则 [Beeri et al. 1989]: 

1) 当 优 套 事 务 的 子 事务 T 请 求 读 一 个 数据 项 时 ， 如 果 设 有 其 他 嵌 套 事务 对 这 个 数据 有 “ 写 
锁 " ， 或 者 T 中 对 那个 数据 有 写 锁 的 所 有 子 事务 是 它 的 祖先 (因而 没有 执行 ) 时 ， 就 批准 一 个 
读 锁 。 

2) 当 人 嵌 套 事务 的 子 事务 Ti 请 求 写 一 个 数据 时 ， 如 果 没 有 其 他 息 套 事务 对 这 个 数据 已 有 一 个 
读 锁 或 写 锁 , 或 者 T 中 对 这 个 数据 有 一 个 读 锁 或 写 锁 的 所 有 子 事务 是 它 的 祖先 (因而 没有 执行 ) 
时 ， 则 批准 一 个 写 锁 。 

3) 子 事务 所 获得 的 锁 一 直 保 持 到 它 提 交 或 异常 中 止 为 止 。 当 子 事务 提交 时 ， 这 个 子 事务 
没有 被 它 的 父 事务 所 持 有 的 锁 会 由 其 父 事 务 继承 。 当 子 事务 异常 中 止 时 ， 这 个 子 事务 没有 被 
它 的 父 事 务 持 有 的 锁 就 被 释放 。 

因为 以 上 规则 是 保证 并 发 事务 隔离 性 规则 的 一 个 超 集 ， 所 以 并 发 民 套 事务 的 调度 是 可 串 
行 化 的 。 要 了 解 这 些 规则 如 何 加 强 兄弟 之 间 所 希望 的 语义 ， 可 以 观察 在 同一 子 树 下 ， 活 动 兄 
弟 事务 的 锁 不 会 与 另 一 活动 兄弟 事务 的 锁 发 生 冲 突 。 因 此 ， 对 子 树 内 的 并 发 活动 兄弟 事务 而 
言 ， 它 们 不 是 以 在 其 子 树 内 执行 的 数据 库 操 作 来 排序 的 ， 兄 弟 事 务 相 对 于 其 他 事务 而 言 是 隔 
离 的 ， 是 以 它们 的 提交 顺序 可 串 行 化 的 。 


.23.7.5 多 级 事务 * 


多 级 事务 的 并 发 控制 可 以 是 常规 控制 和 第 23.4 节 与 23.5 节 [Weikum] 描 述 的 严格 两 段 锁 并 发 
控制 的 泛 化 。 第 一 个 泛 化 利用 各 个 级 别 上 的 操作 语义 ， 第 二 个 泛 化 依赖 于 多 级 的 事实 。 

1. 操作 语义 和 交换 

在 23.6 节 ， 我 们 讨论 了 对 象 上 操作 的 交换 性 如 何 用 于 立即 更 新 的 翡 观 并 发 控制 的 冲突 表 设 
计 ， 这 种 思想 构成 了 多 级 模型 的 核心 部 分 。 

在 一 个 支持 多 级 事务 的 系统 中 ， 每 一 级 有 它 自 己 的 (交叉 ) 调度 表 。 例 如 ， 在 图 21-3 中 ， 
Ls 这 一 级 上 的 调度 Move(sec!，sec) 是 序列 TestInc(sec;)，Dec(sec1) (提示 : Move 将 选修 一 门 
课程 的 学 生 从 一 个 班 移 到 另 一 个 班 ，TestInc 是 有 条 件 地 在 一 个 班 中 增加 学 生 ，Dec 减 少 一 个 班 
中 注册 的 人 数 )， 一 个 更 加 有 意义 的 调度 涉及 多 个 多 级 事务 的 并 发 执行 。 例 如 ，L 的 调度 
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TestInc,(sec.), TestInc,(sec,), Dec2(sec,), Dec,(sec;) (23.3) 
涉及 两 个 事务 Movei(sec!，sec2) 和 Movez(sec1，sec2) 的 交叉 执行 ， 这 两 个 事务 都 是 将 班级 1 中 
的 一 个 学 生 移 到 班级 2 中 去 。 这 个 调度 的 有 趣 之 处 在 于 ， 因 为 两 个 减 操 作 可 交换 ， 所 以 (23.3) 
的 调度 等 价 于 
Testlnci(sec,), Deci(sec!), TestInc,(sec,), Dec2(sec,) (23.4) 
因而 按 Move，Move: 的 顺序 是 可 串 行 化 的 。 注 意 ， 因 为 两 个 针对 相同 元 组 的 TestInc 操 作 不 能 
交换 ， 所 以 按 Movez，Move' 的 顺序 不 可 串 行 化 〈 初 始 状 态 可 能 是 这 样 的 ， 在 加 的 过 程 中 ,第 
一 个 成 功 ， 而 第 二 个 却 失 败 ， 如 果 顺 序 颠 倒 ， 可 能 返回 不 同 的 结果 给 调用 者 )。 
现在 假设 按 在 Li 上 执行 的 操作 检查 调度 (23.3 ) ， 我 们 来 看 下 面 的 序列 : 
Seli(t2), Upd:(t2), Selz(t:), Updz(t2), Upd:(tı), Updi(t) (23.5) 
和 我 们 在 23.6 节 讨论 的 银行 应 用 一 样 ， 因 为 在 相同 元 组 上 的 更 新 操作 一 般 不 能 交换 ， 所 以 
这 两 种 顺序 的 调度 都 是 不 可 串 行 化 的 。 而 且 ， 对 并 发 控制 而 言 ， 可 用 的 语义 越 多 ， 就 能 检测 
到 更 多 并 发 。 
2.L2 的 并 发 控制 
为 利用 语义 ， 我 们 使 用 冲突 表 C:? 为 L: 构 造 并 发 控制 ， 冲 突 表 中 行 和 列 上 的 操作 都 是 L; 级 
所 支持 的 操作 。 例 如 ， 一 个 Move 事 务 是 应 用 级 Ls 上 的 程序 ， 包 含有 对 Ls 级 支持 的 TestInc 和 


Dec 的 调用 操作 。 收 到 这 些 调用 后 ，L2: 级 上 的 
并 发 控制 使 用 冲突 表 C: 来 决定 是 否 服务 ,Ci 如 | | m e| 


图 23-17 所 示 。 为 实现 这 一 目标 ， 它 使 用 








TestInc 和 Dec 锁 。 因 此 ， 在 Move 调 用 Dec(sec,) | estIne | * | * | 
时 ， 如 果 没 有 其 他 事务 在 secz 上 加 TestInc 锁 ， [me | | | 
并 发 控制 就 批准 在 sec: 上 加 一 个 Dec 锁 。 否 则 ， 图 23-17 蕊 级 上 的 并 发 控制 调度 
Dec 请 求 必 须 等 待 ， 一 旦 得 到 锁 ，L? 上 的 程序 Testinc 和 Dec 操 作 的 冲突 表 

”就 得 以 执行 ， 它 通过 调用 Li 级 上 的 Dec 操 作 来 
实现 。 


现在 让 我 们 回 到 原来 的 例子 。 尽 管 (23.3) 的 调度 按 Move!，Moves 的 顺序 是 可 串 行 化 的 ， 
因为 两 个 TestInc 操 作 不 能 交换 ， 所 以 对 这 两 个 事务 加 一 个 顺序 。 因 为 对 23.4 节 所 描述 的 常规 
的 、 悲 观 的 并 发 控制 而 言 ， 当 在 活动 事务 上 强加 一 个 顺序 时 ， 它 们 就 不 会 批准 一 个 请 求 。 对 
也 不 会 产生 (23.4) 这 样 的 调度 : 和 常规 的 并 发 控制 一 样 ， 它 并 不 能 找 出 所 有 的 冲突 可 串 行 
调度 。 但 考虑 下 面 事务 Movei(sec,，secz)，Movez(secl，sec3) 的 交叉 调度 

Testinc,(sec,), TestInc,(sec3), Dec(sec,), Dec,(sec,) (23.6) 

L: 级 的 并 发 控制 允许 这 个 交叉 调度 ， 因 为 两 个 增加 操作 是 可 交换 的 。 当 事务 请 求 提交 时 ， 为 
获得 更 多 的 并 发 ， 在 执行 完 减 操作 后 ， 不 是 立即 提交 ，Meove: 可 能 在 一 段 额 外 的 时 间 内 继续 处 
于 活动 状态 。 通 过 找到 可 交换 的 减 操作 ，L: 并 发 控制 就 能 避免 延迟 Dec;， 一 直到 Move> 释 放 它 
的 锁 为 止 。 

3. 多 级 并 发 控制 

现在 看 来 ， 获 得 最 佳 性 能 的 策略 是 执行 一 个 并 发 控制 来 最 有 效 地 利用 语义 ， 这 一 并 发 控 
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制 处 在 层次 结构 中 的 最 高 层 L。( 图 21-3 的 Lz)。 但 我 们 忽略 重要 的 一 点 。 在 23.4 节 ， 我 们 在 讨 
论 常 规 的 悲观 并 发 控制 时 ， 我 们 假设 由 并 发 控制 调度 的 读 写 操作 是 完全 有 序 的 。 因 此 ， 如 果 
控制 在 一 个 读 操 作 之 后 调度 一 个 写 操作 ， 它 假设 在 写 操作 开始 前 ， 读 操作 已 经 结束 。 利 用 多 
级 并 发 控制 ， 当 操作 冲突 时 ， 这 是 正确 的 ， 但 操作 不 冲突 时 ， 却 不 一 定 正 确 。 因 此 一 个 事务 T 
执行 TestInc(sec!) 时 ， 若 第 二 个 事务 请 求 同 样 的 操作 ， 那 么 它 就 等 待 ， 一 直到 T 执 行 完 为 止 ， 
因为 同一 班 上 的 两 个 TestInc 操 作 冲 突 ， 因 此 这 两 个 操作 是 完全 有 序 的 。 

但 考虑 两 个 不 冲突 的 操作 ， 它 们 并 发 执行 是 并 发 控制 所 允许 的 。 在 图 23-18 中 ，L: 并 发 控 
制 调度 两 个 减 操作 并 发 执行 ， 这 两 个 操作 由 应 用 级 调用 ， 即 运行 在 L, 上 的 实际 事务 程序 ( 事 
务 还 可 以 调用 其 他 操作 ， 但 在 这 里 我 们 不 考虑 这 种 情况 )。 减 操作 是 由 L。 上 的 一 个 程序 ( 子 事 
务 ) 来 实现 的 ， 程 序 调 用 操作 被 LI 支持。 在 这 种 情况 下 ， 减 法 程序 的 每 个 实例 只 作 一 次 这 样 
的 调用 一 一 Upd。L1 上 每 个 Upd 程 序 的 调用 都 调用 读 和 写 操作 ， 它 们 在 Lo 实现 。 


L, Dec(sec,) Dec(sec,) 
Li Upd(t,) Upd(t,) 
Lo Rd(p) Rd(p,) Wr(p.) Wr(pi) 


时 间 一 一 一 > 
图 23-18 在 Lo 上 的 减 操作 不 冲突 ， 但 低级 别 上 的 任意 的 交叉 可 能 导致 问题 


如 图 所 示 ， 每 个 更 新 语句 读 取 存 储 在 元 组 6 中 的 选修 人 数 的 值 ， 对 值 做 减法 ， 因 此 存 回 6 
的 值 也 是 相同 的 。 尽 管 执行 两 次 减 操作 ， 但 选课 人 数 只 减 一 次 ， 这 是 在 2.3 节 介绍 的 丢失 更 新 
问题 的 例子 。 丢 失 更 新 的 原因 在 于 这 两 个 Upd 操 作 之 间 不 是 相互 隔离 的 。 

为 避免 发 生 这 类 问题 ， 多 级 事务 使 用 多 级 并 发 控制 ， 它 保证 在 每 一 级 上 的 操作 是 可 串 行 
化 的 ， 因 和 而 是 完全 有 序 的 。 多 级 并 发 控制 (multilevel concurrency control) 由 各 级 上 的 控制 组 
成 ， 因 此 ， 处 在 L; 的 控制 按照 冲突 表 C, 调 度 来 自 Lu 的 子 事务 调用 操作 ， 冲 突 表决 定 这 些 操作 
是 否 可 以 并 发 执行 。 和 前 面 所 描述 的 一 样 ， 控 制 给 每 个 操作 加 锁 ， 当 子 事务 在 Li 级 提交 时 就 
释放 锁 ， 图 23-19 就 是 这 样 的 一 个 组 织 。 

多 级 并 发 控制 的 目标 就 是 要 确保 任意 级 别 上 的 程序 调用 操作 能 有 效 地 相互 隔离。 换 句 话 
说 ， 在 应 用 级 上 ， 事 务 调用 的 操作 是 由 L, 中 的 一 个 程序 来 执行 的 ， 可 以 把 这 个 程序 看 作 一 个 
子 事务 。 这 个 子 事务 调用 一 系列 的 操作 ， 每 个 操作 由 L,, 上 的 程序 来 实现 。 如 果 L, 的 并 发 控制 
决定 op; 和 op (由 两 个 应 用 事务 来 调用 ) 可 以 并 发 地 执行 ， 事 务 的 调度 由 L, 上 的 子 程序 产生 ， 
这 些 调度 在 L,-, 上 是 交叉 的 。 为 保证 op1 和 opz 有 效 地 隔离 ，L,_1 上 由 子 事务 产生 的 交叉 调度 必 
须 是 可 串 行 化 的 ， 即 它 和 单个 序列 的 串 行 调 度 是 等 价 的 。 注 意 ， 等 价 的 串 行 顺 序 并 不 重要 ， 
因为 op 和 op: 是 可 以 交换 的 ， 因 此 这 两 种 顺序 产生 相同 的 结果 。L, 上 的 并 发 控制 要 求 L， + 上 的 
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调度 只 和 一 些 串 行 调度 等 价 。 


级 Liss 





有 一 Lat es 






事务 调度 【LL 操作 调用 的 ) 





图 23-19 多 级 并 发 控制 中 各 级 之 间 的 联系 


为 达到 这 一 目标 ， 我 们 需要 L,, 上 的 并 发 控制 保证 这 一 级 上 的 调度 是 可 串 行 化 的 。L，, 控 
制 假设 它 调度 的 操作 是 隔离 的 单元 ， 而 事实 却 不 是 这 样 ;它们 是 L，; 上 的 子 事务 。 因 此 ，L，， 
上 的 并 发 控制 有 必要 保证 这 些 事务 是 可 串 行 化 的 。 

我 们 依 此 进行 推理 ， 把 图 23-18 作 为 一 个 例子 ， 来 看 为 什么 图 中 Lo 上 的 调度 不 能 由 多 级 并 
发 控制 产生 。 应 用 级 上 的 两 个 事务 (不 在 图 中 ) 并 发 地 调用 Dec(sec))。L; 的 控制 看 到 这 两 个 
操作 是 可 交换 的 ， 因 此 它 批准 这 两 个 事务 各 自在 sec, 上 加 Dec 锁 ， 人 允许 世上 实现 Dec 的 子 事务 
的 两 个 调用 并 发 执行 。L? 上 的 每 个 子 事务 是 调用 Upd(t) 的 程序 这些 调 用 被 传 给 控制 L L 
的 第 一 个 子 事务 获得 在 0 上 的 Upd 锁 ， 但 第 二 个 子 事务 却 要 等 待 ， 因 为 Upd 锁 冲突 。 因 此 ， 在 
L, 上 ， 只 有 一 个 更 新 子 事务 的 调用 被 启动 。 它 调用 p, 上 的 读 写 操作 。 这 些 被 传 给 Lu 上 的 控制 ， 
所 批准 更 新 子 事务 和 调度 操作 在 p, 上 的 锁 。 当 更 新 子 事务 提交 时 ， 它 释放 页 锁 ， 并 返回 给 调 
用 它 的 Dec 子 事务 。 当 Dec 提 交 时 ， 它 释放 Upd 锁 ， 因 而 允许 更 新 子 事务 开始 第 二 次 调用 ， 并 
返回 给 调用 它 的 应 用 事务 。 这 样 ， 和 图 23-18 相 反 ，Lo 上 的 调度 是 可 串 行 化 的 。 

使 用 和 23.6 节 相同 的 推理 ， 我 们 看 到 所 有 由 这 个 并 发 控制 产生 的 调度 是 可 恢复 的 ( 即 补偿 
操作 能 正确 地 工作 ， 在 事务 异常 中 止 时 能 保证 原子 性 )。 


23.8 其 他 的 并 发 控制 


在 商业 系统 中 ， 锁 是 大 多 数 (但 不 是 所 有 ) 并 发 控制 算法 的 基础 在 本 节 中 ， 我 们 讨论 
两 个 不 是 锁 的 算法 : 时 间 惟 顺序 的 并 发 控制 和 乐观 并 发 控制 。 时 间 惟 顺序 算法 ， 是 一 个 我 们 
在 前 面 提 到 的 算法 ， 它 说 明 使 用 时 间 发 来 获得 同步 。 乐 观 并 发 控制 是 一 个 新 出 现 的 方法 ， 对 
一 些 特定 的 应 用 有 前 景 。 在 第 24 章 中 ， 我 们 将 讨论 另外 的 算法 一 多 版 本 的 并 发 控制 ， 它 在 
商业 关系 数据 库 系统 中 实现 。 
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23.8.1 时 间 瞪 顺序 的 并 发 控制 


时 间 惟 顺序 并 发 控制 (timestamp-ordered concurrency control ) 中 ， 事务 T 在 启动 时 被 分 
配 一 个 唯一 的 时 间 戳 TSCT)， 并 发 控制 保证 存在 一 个 等 价 的 串 行 调度 ,- 该 调度 中 的 事务 是 按时 
间 心 排序 的 。 由 于 这 个 原因 ， 时 间 惟 顺序 控制 是 静态 的 (static )， 也 就 是 说 ， 等 价 的 串 行 顺序 
在 它们 启动 时 就 确定 了 。 事 务 按 它们 的 启动 顺序 串 行 化 ， 而 不 必 按 提交 的 顺序 串 行 化 。 用 锁 
可 以 产生 唯一 的 时 间 戳 ， 事 务 启 动 时 的 时 钟 值 作为 时 间 惟 。 只 要 时 钟 的 滴答 比 事务 启动 的 速 
度 快 ， 那 么 每 个 事务 就 能 获得 一 个 唯一 的 时 间 惟 。 我 们 描述 一 个 立即 更 新 的 时 间 蕉 顺序 控 
制 ， 延 迟 更 新 也 可 能 使 用 时 间 蕉 顺序 控制 。 

时 间 戳 顺序 控制 用 一 个 数据 项 x 来 存储 下 列 信息 : 

ert: 任何 读 x 的 事务 的 最 大 时 间 惟 。 

。wt(x): 任何 写 * 的 事务 的 最 大 时 间 惟 。 

。 f(x): 一 个 标志 ， 它 表明 最 后 写 * 的 事务 是 否 提交 。 
保持 这 些 信息 意味 着 会 有 额外 的 开销 ， 这 是 该 策略 的 缺点 。 需 要 用 额外 的 空间 来 将 它们 分 别 
存在 数据 库 中 。 而 且 ， 因 为 这 些 信息 是 存储 在 数据 库 中 ， 必 须 像 本 地 数据 一 样 进行 更 新 ， 即 
它们 必须 被 存储 在 磁盘 上 。 而 且 ， 如 果 事 务 异 常 中 止 ， 它 们 必须 被 回 退 。 和 其 他 的 控制 相反 ， 
这 意味 着 对 数据 x 的 读 就 导致 rtoo 的 写 。 结 果 ， 时 间 惟 顺序 算法 没有 获得 广泛 使 用 。 

当 事 务 Ti 请 求 读 xz 时， 并 发 控制 执行 以 下 动作 : 

(DR, ， 

-如 果 TSCT)<wtC0， 那 么 在 等 价 的 串 行 (时 间 发 ) 顺序 中 ， 必 须 在 Ti 之 后 的 某 些 事务 T; 
(TS(T,)>TS(T,)) 可 以 写 一 个 新 值 到 x 中 ，TI 的 读 操作 应 在 T, 写 操作 之 前 返回 x 的 值 ， 但 这 个 值 
在 数据 库 中 已 经 不 存在 。 因 此 ，Ti 太 老 (有 一 个 太 小 的 时 间 戳 ) 不 能 读 x， 它 就 被 异常 中 止 并 
重启 (有 一 个 新 的 时 间 蕉 )。 

(2) Ro 

如 果 TS(T1)>wt(x)， 那 么 分 两 种 情形 : 

* 如 果 f(x) 表 示 x 的 值 已 经 提交 ， 请 求 就 被 批准 ， 如 果 TS(T,)>rt(x)， 就 把 TS(T1) 的 值 赋 给 

rt(x). 

* 如 果 f(x) 表 示 x 的 值 还 没有 提交 ，T; 必 须 等 待 ( 避免 脏 读 )。 

当 一 个 事务 T, 请 求 写 x 时 ， 并 发 控制 执行 以 下 动作 : 

(wi 

MURTS(T, <ta), FESTA F CER) 顺序 中 ， 必 须 在 T| 之 后 的 某 些 事务 T, 读 x 以 前 
的 值 。 车 允许 Ti 提交 ， 那 么 T: 也 必须 读 Ti 请 求 写 的 值 。 因 此 ，Ti 太 老 不 能 写 x， 它 就 异常 中 目 
并 重启 〈( 有 一 个 新 的 时 间 戳 )。 

(2) W: 

如 果 rt(O<TSCT)<wtCO ， 那 么 在 按时 间 蕉 顺序 的 串 行 调度 中 ， 事 务 存 新 值 到 xz 中 ， 以 覆盖 


O ”在 网 络 中 ， 每 个 站 点 使 用 它 自 己 的 本 地 时 钟 产生 时 间 惟 ， 这 样 的 算法 就 不 能 保证 时 间 惟 的 唯一 性 。 为 了 保 
证 时 间 戳 的 唯一 性 ， 必 须 对 算法 进行 修改 ， 给 每 个 站 点 设置 一 个 唯一 的 标识 。 站 点 把 这 个 标识 添加 到 时 钟 
值 来 构成 时 间 蕉 。 因 此 站 点 ;的 时 间 惟 为 (ci, id)， 这 里 c 是 当前 的 时 钟 值 ，id 是 第 ;个 唯一 的 标识 符 。 
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TARBE (因为 TS(T1)<wt(x))。 而 且 ， 没有 时 间 玲 处 在 TS(T1) 和 wt(x) 之 间 请 求 读 x 的 事务 
(因为 rt(x)<TS(T)): . 

。 如 果 f(x) 表 示 x 的 值 已 经 提交 ， 任 何 时 间 规 处 于 TS(T,) 和 wt(x) 之 间 的 试图 读 * 的 后 续 事 务 

都 将 异常 中 止 (参见 R,)。 因 此 ，T, 请 求 写 的 值 将 不 能 被 任何 其 他 事务 读 ， 对 数据 库 的 

最 终 状 态 也 就 没有 影响 。 因 此 ， 请 求 被 批准 ， 但 写实 际 上 没有 完成 。 这 被 称 为 Thomas 

写 规则 fThomas 1979] (这 种 情况 下 不 执行 写 操作 )。 . 

。 如 果 f(x) 表 示 x 不 是 一 个 已 提交 的 值 ，T, 必 须 等 待 ( 因为 最 后 写 x 的 事务 可 能 异常 中 止 ， 

T, 请 求 写 的 值 变 成 当前 的 值 )。 

(3) Ws 

如 果 wt(x)，rt(x)<TS(T1)， 那 么 分 两 种 情形 : 

。 如 果 f(x) 表 示 x 不 是 一 个 已 提交 的 值 ， 那 么 T, 必 须 等 待 ， 因 为 批准 请 求 会 使 回 退 变 得 复杂 

(参见 23.2 节 的 讨论 )。 

。 如 果 f(x) 表 示 x 是 一 个 已 提交 的 值 ， 那 么 请 求 就 被 批准 ， 将 TS(T,) 的 值 赋 给 wt(x)，f(x) 的 

值 设 成 未 提交 (以 后 当 Ti 提 交 时 ，f(x) 就 设 成 已 提交 的 状态 )。 

图 23-20 显 示 的 请 求 序列 说 明了 这 些 规 则 。 假 设 TS(T,)<TS(T,)， 在 时 刻 。，x 和 y 读 写 的 时 
间 惟 都 小 于 TSGT)，x 和 ?都 有 已 提交 的 值 。 然 后 在 hb 时 刻 ， 应 用 规则 R。， 批准 读 请 求 ， 把 rt(y) 
BERTS). 在 6 时刻 ,使 用 W:,， 批准 写 的 请 求 ， 把 wt(Oy) 设 成 TSCT2)， 把 fy) 设 成 表示 y 未 提交 。 
在 6 了 时刻， 再 次 应 用 W:， 批 准 写 的 请 求 ， 把 wt(z) 设 成 TS(T2) ， 因 为 T: 立 即 提交 ， 所 以 f(z 和 
f(y) 都 表示 已 提交 的 值 。 在 tt 时 刻 ， 应 用 W，， 因 为 rt(x) 没 有 变化 ，wt(x) 现 在 的 值 是 TS(T;)。 请 
求 被 批准 ， 但 写实 际 上 没有 完成 ，wt(x) 设 有 被 更 新 。 





图 23-20 时 间 惟 顺序 并 发 控制 楼 受 的 请 求 的 顺序 。 假 设 TS(T)<TSCT2)， 读 写 z 和 ?的 
时 间 长 的 初始 值 小 于 这 两 个 事务 的 时 间 蕉 ，T 最 终 的 写 操作 没有 完成 


因此 ， 时 间 长 控制 接受 一 个 时 间 惟 序列 ， 但 我 们 并 不 把 它 当 作 是 一 个 调度 ， 因 为 控制 并 
没有 将 最 终 写 的 结果 提交 给 数据 库 。 注 意 ， 这 个 序列 不 冲突 等 价 于 一 个 品行 调度 ， 也 不 被 一 
个 基于 冲突 等 价 的 并 发 控制 所 接受 。 这 意味 着 时 间 发 顺序 控制 只 接受 不 被 基于 两 段 锁 的 控制 
所 接受 的 请 求 序列 。 练 习 23.38 要 求 你 给 出 一 个 被 两 段 锁 并 发 控制 接受 的 调度 ， 但 它 不 被 时 间 
惟 顺 序 控制 所 接受 。 这 样 ， 这 两 类 控制 是 无 法 比较 的 ， 因 为 其 中 一 类 控制 所 接受 的 调度 不 被 
另 一 类 控制 所 接受 。 


23.8.2 乐观 的 并 发 控制 


通常 ， 乐 观 算法 由 以 下 几 个 步 又 组 成 。 第 一 步 ， 在 一 些 简 化 任务 性 能 的 假设 (乐观 的 ) 
下 执行 一 个 任务 。 例 如 ， 在 并 发 控制 中 ， 任 务 是 一 个 事务 ， 假 设 是 不 会 出 现 冲 突 的 并 发 事务 。 
因此 ， 我 们 不 需 考 虚 加 锁 和 等 待 。 事 务 的 读 和 写 不 需要 得 到 并 发 控制 的 许可 ， 因 此 ， 与 基于 
DH) GERM) 算法 相反 ， 它 不 会 延迟 。 第 二 步 是 通过 检查 假设 是 否 为 真 来 对 第 一 步 进行 验 
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证 。 如 果 假 设 不 为 真 ， 任 务必 须 重 做 ， 这 是 并 发 控制 中 回 退 的 情形 。 如 果 假 设 为 真 ， 验 证 结 
果 导 致 结果 提交 。 

这 个 方法 和 悲观 的 方法 相反 ， 在 斐 观 的 方法 中 ， 任 务 的 执行 是 谨慎 的 ， 它 并 不 在 第 一 步 
中 简化 假设 ， 每 一 个 对 数据 库 的 访问 都 事先 进行 检查 ， 如 果 检 测 到 冲突 ， 就 立即 采取 适当 的 
措施 。 因 此 在 悲观 的 方法 中 ， 没 有 第 二 个 步骤 (验证 )。 

因为 第 一 步 中 没有 对 数据 库 的 访问 进行 检查 ， 所 以 实际 上 是 可 能 发 生 冲 突 的 ， 乐 观 并 发 
控制 [Kung and Robinson 1981] 通 常 使 用 延迟 更 新 的 方法 来 防止 不 正确 事务 执行 的 结果 在 数据 
库 中 传播 (如果 使 用 一 个 立即 更 新 的 方法 ， 将 在 以 后 回 退 的 事务 的 更 新 操作 对 与 其 并 发 执行 
的 事务 来 说 是 可 见 的 ， 这 会 导致 一 个 级 联 异 常 中 止 ) ， 写 人 的 新 值 存储 在 一 个 意向 表 中 ， 但 并 
不 用 来 对 数据 库 作 立 即 更 新 。 因 此 ， 修 改 数据 库 的 事务 需要 第 三 步 ， 并 且 验 证 意向 表 是 否 写 
人 数据 库 中 。 

因为 回 退 是 有 代价 的 ， 所 以 只 有 在 乐观 假设 有 效 的 情况 下 ， 乐 观 算法 才 是 合适 的 。 注 意 ， 
在 乐观 算法 中 ， 回 退 的 代价 比 时 间 发 顺序 算法 的 回 退 代价 更 高 ， 因 为 在 事务 完成 后 ， 要 做 出 
是 否 回 退 的 决定 。 对 时 间 改 顺序 控制 而 言 ， 回 退 决定 是 在 事务 还 在 执行 时 做 出 的 ， 它 耗费 较 
少 的 系统 资源 。 由 于 死 锁 ， 回 退 在 悲观 算法 中 还 是 可 能 发 生 的 。 乐 观 算法 的 一 个 重要 优点 是 
不 会 发 生死 锁 ， 因 为 一 个 事务 不 会 等 待 另 一 个 事务 。 比 较 乐 观 算法 和 悲观 算法 的 效率 ， 相 对 
锁 的 代价 ， 验 证 和 意向 表 的 管理 必须 加 权 。 

因为 数据 库 在 第 一 步 中 不 会 被 修改 (可 能 请 求 写 ， 但 实际 上 没有 执行 )， 这 一 步 被 称 作 读 
阶段 (read phase)， 第 二 步 被 称 为 验证 阶段 (validation phase)， 第 三 步 被 称 作 写 阶段 (write 
phase)。 因 此 ， 事 务 的 写 是 在 写 阶段 完成 的 (在 一 个 调度 中 出 现 )。 为 简单 起 见 ， 我 们 起 初 假 
设 验证 和 写 阶段 是 关键 部 分 ， 因 此 一 个 时 刻 ， 只 有 一 个 事务 处 在 验证 阶段 或 写 阶段 。 但 我 们 
稍 后 将 修改 这 个 假设 ， 一 个 事务 的 三 个 阶段 如 图 23-21a 所 示 。 

给 证 阶段 确保 由 乐观 并 发 控制 产生 的 任意 调度 S 是 和 调度 S“ 等 价 的 。 在 S” 中 ， 已 提交 事 
务 是 按 提交 的 顺序 执行 的 ， 因 此 它们 的 操作 先 于 那些 未 提交 事务 的 操作 。 

如 果 事 务 Ti 在 读 阶 段 执行 的 操作 (回忆 一 下 ， 在 数据 库 的 读 阶段 是 没有 写 操作 的 ) 不 与 
其 他 事务 的 操作 相 冲 突 ， 这 些 事务 在 Ti 的 读 阶段 处 于 活动 状态 ， 在 Ti 进入 验证 阶段 之 前 提交 ， 
那么 Ti 就 成 功 通过 验证 ， 并 提交 。 如 果 Ts 在 Ti 进入 读 阶段 之 前 完成 它 的 写 阶段 ， 如 图 23-21b 所 - 
示 ， 那 么 这 两 个 事务 不 会 并 发 地 处 在 活动 状态 。 这 种 情形 之 下 ， 不 论 是 在 调度 S 还 是 在 S“ 中 ， 
Ti 的 所 有 操作 都 在 T; 之 后 ， 且 不 会 发 生 冲 突 。 但 假设 T: 在 Ti 进入 验证 阶段 之 前 完成 ， 在 Ti 开始 
它 的 读 阶段 之 前 ，T: 还 没有 完成 它 的 写 阶 段 ， 如 图 23-21c 所 示 。 而 且 ， 假 设 Ti 读 T, 写 的 数据 ， 
Ti 的 读 可 能 先 于 Tz 的 写 ， 在 这 种 情况 下 ， 冲 突 操 作 的 顺序 是 与 提交 顺序 T2T, 相 反 的 。 因 此 ， 不 
和 允许 Ti 成 功 通过 验证 。 由 于 这 个 原因 ， 一 些 并 发 事务 的 读 写 操作 在 Ti 处 在 读 阶段 时 提交 ， 事 
务 与 这 样 一 些 事务 的 冲突 验证 测试 如 下 : T 读 的 数据 集 不 与 任何 事务 写 的 数据 集 相 交 ， 这 些 
事务 的 写 阶段 与 Ti 的 读 阶 段 相 重 登 。 | 

注意 ， 当 T, 验 证 时 ， 唯 一 的 检查 只 考虑 T, 的 读 操 作 ， 但 不 包括 T, 写 操作 的 冲突 检查 。 尽 管 
Ti 写 一 个 T 读 或 写 的 记录 可 能 发 冲突 ， 但 在 一 个 时 刻 只 有 一 个 事务 处 于 验证 阶段 或 写 阶段 的 
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事实 保证 T, 的 写 (在 它 的 写 阶段 ) 是 在 T: 的 读 (在 读 期 间 ) RS (在 写 期 间 ) 之 后 。 因 此 ， 
假设 T, 提 交 ， 则 操作 以 提交 的 顺序 执行 ( 即 在 S 和 S* 中 ， 它 们 的 顺序 是 -- 样 的 )。 所 以 ， 即 使 
T: 的 读 或 写 与 Ti 的 写 发 生 冲 突 ，T, 也 能 成 功 地 通过 验证 ， 因 为 构成 S“ 的 操作 不 必 交 换 (也 可 
以 用 另 一 种 方法 : 当 T: 不 再 处 于 活动 状态 时 ，Ti 的 写 已 经 完成 ， 因 此 不 要 考虑 冲突 )。 


读 阶段 了 验证 /和 写 阶 段 T 
cet TS 





> 时 间 
a) 一 个 事务 的 三 个 阶段 








验证 / 写 阶段 T2 
一 一 一 一 一 一 ~ 
、 ， 一 时 间 
AT, 
b) 非 并 发 的 事务 
验证 / 写 阶 段 T 
—_ oS 
、 , > 时 间 
RPT, 


©) WAT ROSE RK ST, SRR ER, IAT, STM 


验证 / 写 阶段 T 
OO 





N ,和 j > 时 间 
GET, 验证 / 写 阶段 Ti 
d) 如 果 了 T 读 或 写 的 数据 集 与 T; 写 的 数据 集 重 登 ， 那 么 Ti 与 T 冲 突 
图 23-21 在 一 个 乐观 并 发 控制 中 的 事务 
我 们 已 经 假设 ， 在 任何 时 刻 ， 只 有 一 个 事务 处 在 验证 阶段 和 号 阶段 (这 被 称 为 串 行 验证 
(serial validation ) ) 。 因 此 ， 等 价 的 事务 提交 顺序 就 是 事务 进入 验证 阶段 的 顺序 ( 即 提交 顺 
序 )， 没 有 两 个 事务 同时 处 于 写 阶 段 。 尽 管 这 一 假设 简化 了 验证 ， 但 它 产 生 了 瓶颈 ， 从 而 限 
制 了 并 发 。 
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另 一 个 办 法 是 并 行 验证 (parallel validation )， 它 可 以 通过 人 允许 事务 并 发 地 执行 它们 的 验 
证 阶段 或 写 阶 段 来 避免 瓶颈 。 利 用 申 行 验 证 ， 事 务 进入 验证 阶段 的 顺序 是 等 价 的 串 行 顺序 。 
所 以 ， 除 必须 满足 顺序 验证 的 条 件 外 ， 一 个 事务 Ti 在 进入 它 的 验证 阶段 时 ， 必 须 阻 止 其 他 事 
务 T; 在 同一 时 刻 也 进入 验证 阶段 或 写 阶段 (因为 这 些 事务 在 等 价 的 串 行 序列 中 是 先 于 Ti 的 )。 
对 这 样 的 事务 集 ， 必 须 考 虑 它们 之 间 的 写 操作 冲突 (发 生 在 并 发 的 写 阶段 )。 在 Ti 提交 之 前 ， 
必须 满足 两 个 条 件 。 第 一 个 条 件 与 串 行 验证 的 相同 : 如 果 T 的 读 阶 段 与 Tz 的 验证 阶段 或 写 阶 
段 重 登 ， 那 么 Ti 读 的 数据 集 必 须 与 T? 写 的 数据 集 不 相交 。 另 外 ， 如 果 Tz 在 Ti 之 前 进入 验证 阶段 
或 写 阶 段 ， 这 些 阶 段 是 重 又 的 ， 如 图 23-21d 所 示 。 为 保证 T! 能 成 功 地 通过 验证 ，T1 所 写 的 数 
据 集 必须 与 T, 写 的 数据 集 不 相交 。 


23.9 参考 书目 


介绍 并 发 控制 的 两 本 非常 好 的 书 是 [Bernstein et al. 1987,Papadimitriou 1986]。 更 多 的 理论 上 的 研究 
在 [Lynch et al. 1994] 中 给 出 。 
品行 化 的 概念 和 两 段 锁 在 [Eswaran et al. 1976] 中 有 所 介绍 。 如 果 调 度 不 是 可 串 行 化 的 ， 则 存在 一 个 
完整 性 约束 ， 调 度 违反 这 个 完整 性 约束 ， 这 在 [Rosenkrantz et al. 1984] 中 给 出 证 明 。 可 恢复 性 和 严格 性 
-是 在 [Hadzilacos 1983] 中 介绍 的 。[Weihl 1988] 介 绍 了 向 前 和 向 后 交换 ， 在 [Lynch et al. 1994] 有 更 加 详细 
的 讨论 。 本 书 关于 幅 套 事务 执行 的 介绍 取 自 于 [Beeri et al. 1989]， 多 级 事务 的 介绍 来 自 [Weikum 1991]。 
时 间 惟 顺序 并 发 控制 最 先是 在 [Thomas 1979] 中 描述 的 ， 这 本 书 还 介绍 了 Thomas 写 规则 。{[Kung and 
Robinson 1981] 介 绍 了 乐观 并 发 控制 。[Lampson et al. 1981] 首 次 提出 了 意向 表 。 基 于 应 用 的 语义 《而 不 
是 操作 语义 ) 设计 并 发 控制 的 其 他 方法 在 [Bernstein et al. 1999b,Bernstein et al. 1999a,Bernstein et al. 
1998,Bernstein and Lewis 1996] 中 进行 了 讨论 。 


23.10 练习 


23.1 试 述 下 列 哪些 调度 是 可 串 行 化 的 

a. 1 (x)ro(y)ri(z)r3(z)re(x)ri(y) 

b. r(x) wa(y)r) (z)r3(z) W(x) 1) 

c. ¥1(x)Wa(y)ri(z)t3(z)w (x) ray) 

d. r,(x)r2(y)r)(z)r3(z) wi (x) Way) 

e. 11(x)to(y) Wie) wax) way) 1) 

f. wi(x)ro(y)ri(z)r3(z) r(x) way) 

B. 11(Z)Wo(x)t2(z)t2(y) Wi (x) waz) WO TX) 

23.2 .给 出 对 应 于 23-5 所 示 的 串 行 图 的 所 有 可 能 的 冲突 等 价 串 行 调度 。 

23.3 使 用 一 个 串 行 图 来 阐明 图 23-4 所 示 的 调度 不 是 冲突 可 串 行 化 的 。 

23.4 假设 我 们 在 数据 库 模式 上 定义 所 有 的 数据 库 完整 性 约束 ， 以 便当 事务 的 更 新 违反 这 些 完整 性 约束 
时 ， 数 据 库 管理 系统 不 允许 事务 提交 。 而 且 ， 即 使 我 们 不 使 用 任何 并 发 控制 ， 数 据 库 仍然 保持 一 
致 性 ， 试 解释 我 们 为 什么 还 是 要 使 用 并 发 控制 。 

23.5 试 举 出 一 个 包含 两 个 事务 的 调度 的 例子 ， 它 保持 数据 库 的 一 致 性 (数据库 满足 它 所 有 的 完整 性 约 
束 )， 但 数据 库 最 终 没 有 反映 出 这 两 个 事务 的 影响 。 

23.6 试 证 明 冲突 等 价 包含 视图 等 价 。 
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23.7 试 举 出 一 个 调度 的 例子 ， 其 中 学 生 注册 系统 中 的 事务 出 现 死 锁 。 

23.8 利用 两 段 锁 协 议 ， 试 证 明 一 个 可 能 的 等 价 串 行 顺序 是 这 些 事务 第 一 次 释放 锁 的 顺序 。 

23.9 试 举 出 一 个 你 所 见 到 的 不 同 于 银行 处 理 系统 事务 处 理 系统 的 例子 ， 在 这 个 系统 中 ， 串 行 顺序 就 是 
事务 提交 的 顺序 。 

23.10 试 举 出 一 个 调度 的 例子 ， 该 调度 是 可 串 行 化 的 ， 但 不 是 严格 的 。 

23.11 试 举 出 一 个 调度 的 例子 ， 该 调度 是 严格 的 ， 但 不 是 可 串 行 化 的 。 

23.12 试 举 出 一 个 调度 的 例子 ， 该 调度 是 由 非 严 格 两 段 锁 并 发 控制 所 产生 的 ， 但 不 是 可 恢复 的 。 

23.13 试 举 出 一 个 由 可 恢复 的 但 非 严格 的 并 发 控制 所 产生 的 调度 ， 它 涉及 三 个 事务 ， 当 死 锁 发 生 时 ， 导 
致 所 有 三 个 事务 级 联 异 常 中 止 。 l 

23.14 试 举 出 一 个 调度 的 例子 ， 它 由 非 严格 的 两 段 锁 并 发 控制 产生 ， 是 可 串 行 化 的 ， 但 不 是 以 提交 的 硕 
序 可 串 行 化 的 。 

23.15 假设 account 对 象 〈 它 的 冲突 表 如 图 23-16 所 示 ) 有 一 个 额外 的 操作 balance， 该 操作 返回 账户 的 余 
额 。 为 这 个 对 象 设计 一 个 包含 新 操作 的 新 冲突 表 。 

23.16 考虑 下 面 这 个 包含 三 个 事务 的 调度 

TOOTO TA WY WX IAX) 

a. 定义 Ti ATZAR 和 序列 。 
b. 按照 什么 顺序 Ts 能 看 见 数据 库 的 内 容 。 
c. 调度 是 可 串 行 化 的 吗 ? 
d. 假设 每 个 事务 都 是 一 致 的 ， 数 据 库 的 最 终 状 态 满足 所 有 的 完整 性 约束 吗 ? 
e.T; 所 看 到 的 数据 库 状 态 满足 完整 性 约束 吗 ” 请 说 明 原 因 。 | 

23.17 假设 除 read(x) 和 write(x) 操 作 外 ， 数 据 库 还 有 copy(x, y) 操 作 ， 访 操作 自动 地 将 存储 在 x 中 的 值 复制 
到 y 中 去 。 为 使 用 在 立即 更 新 的 悲观 并 发 控制 中 使 用 的 这 些 操作 设计 一 个 冲突 表 。 

23.18 假设 有 一 个 queue 对 象 ， 有 enqueue 和 dequeue 操 作 ， 如 果 队 列 中 没有 数据 项 ，dequeue 返 回 NO。 
而 enqueue 总 是 成 功 完 成 。 使 用 部 分 操作 和 向 后 交换 为 这 个 对 象 设 计 一 个 冲突 表 。 

23.19 设 一 对 数据 库 操 作 (部 分 ) p 和 q。 在 定义 p 和 q 的 每 个 数据 库 状态 中 ， 如 果 定 义 序 列 p,q 和 q,p， 而 
且 序 列 p 和 q 都 返回 相同 的 值 ， 数 据 库 的 最 终 状 态 也 是 相同 的 ， 这 时 我 们 说 操作 p 和 q 是 可 向 前 交换 
的 (forward-commute )。 
a. 描述 在 设计 延迟 更 新 的 悲观 并 发 控制 时 ， 向 前 交换 是 如 何 实现 的 ? 
b. 对 图 23-16 中 描述 的 account 对 象 ， 为 这 样 的 控制 设计 一 个 冲突 表 。 

23.20 设计 一 个 延迟 更 新 的 悲观 并 发 控制 。 

23.21 在 实现 链 事务 了 时 ,链接 下 一 个 子 事务 的 子 事务 释放 它 的 某 些 锁 ， 这 些 锁 对 后 续 的 子 事务 是 不 必要 
的 ， 解 释 这 怎么 能 影响 到 链 式 事务 结果 的 ACID 性 质 。 

23.22 我 们 希望 确保 使 用 可 恢复 队列 的 事务 集 是 隔离 的 。 试 解释 队列 的 实现 是 如 何在 队列 指针 和 队列 中 
的 数据 项 上 加 锁 的 。 

23.23 试 给 出 系统 中 一 个 不 可 串 行 化 的 调度 ， 该 系统 使 用 可 恢复 队列 ， 其 中 在 enqueue 和 dequeue 操 作 完 
成 之 后 ， 事 务 提交 之 前 ， 加 在 队 首 指针 和 队 尾 指针 上 的 锁 都 被 释放 。 i 

23.24 假设 ATM 系 统 上 的 取款 事务 是 包含 两 个 子 事务 的 做 套 事务 ， 其 中 一 个 子 事务 验证 用 户 提供 的 PIN 
码 ， 与 所 给 账户 相关 ， 另 一 个 子 事务 完成 从 账户 余额 中 取款 。 假 设 两 个 这 样 的 事务 试图 并 发 地 从 
同一 账户 提取 现金 。 试 解释 为 什么 这 样 的 调度 是 可 能 的 ， 调 度 中 先 执行 两 个 子 事务 的 PIN 码 验证 ， 
然后 执行 两 个 取款 子 事务 。 
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试 给 出 这 样 一 个 调度 ， 在 悲观 并 发 控制 中 ， 它 先 让 一 个 事务 等 待 ， 但 之 后 又 允许 这 个 事务 提交 ， 

而 在 乐观 并 发 控制 中 ， 它 却 重启 事务 。 l 

试 给 出 这 样 一 个 调度 ， 在 悲观 并 发 控制 中 ， 它 先 让 一 个 事务 等 待 ， 但 之 后 又 允许 这 个 事务 提交 ， 

而 在 乐观 并 发 控制 中 ， 它 却 允 许 事务 不 必 等 待 就 提交 。 

试 给 出 这 样 一 个 调度 (不 会 因为 锁 而 延迟 )， 它 在 立即 更 新 的 、 悲 观 的 、 严 格 的 两 段 锁 并 发 控制 

中 是 可 以 接受 的 ， 但 乐观 并 发 控制 却 重启 其 中 的 一 个 事务 。- 

死 锁 可 能 在 本 章 中 描述 的 时 间 截 顺序 控制 中 发 生 吗 ? 

试 给 出 一 个 由 时 间 玲 顺序 并 发 控制 所 产生 的 调度 例子 ， 其 中 串 行 顺序 不 是 提交 的 顺序 。 

试 给 出 一 个 严格 的 、 可 串 行 化 调度 的 例子 ， 但 不 是 按 提交 顺序 ， 它 既 可 以 由 时 间 蕉 顺序 并 发 控制 

产生 ， 也 可 以 由 两 段 锁 并 发 控制 产生 。 

试 述 下 面 提 出 的 协议 对 时 间 戳 顺序 并 发 控制 来 说 是 不 可 恢复 的 。 

为 每 个 被 事务 〈 不 必 是 已 提交 的 ) 读 过 的 数据 项 保育 最 大 的 时 间 礁 ， 为 每 个 被 事务 (不必 是 

已 提交 的 ) 写 过 的 数据 项 保存 最 大 的 时 间 专 。 

当 一 个 事务 请 求 读 (5) 一 个 数据 项 时 ， 如 果 请 求 事务 的 时 间 蕉 比 所 要 写 ( 读 ) 的 数据 项 的 

时 间 礁 小 ， 就 重启 事务 ， 否 则 批准 请 求 。 

Kill-Wait 并 发 控制 结合 了 立即 更 新 并 发 控制 和 时 间 戳 顺序 控制 的 概念 ， 在 时 间 截 顺序 系统 中 ， 当 

一 个 事务 Ti 启动 时 ， 给 它 分 配 一 个 时 间 蕉 TS(T)。 但 系统 使 用 与 立即 更 新 翡 观 并 发 控制 相同 的 冲 

突 表 ， 解 决 冲突 使 用 的 规则 如 下 : 

如 果 事 务 Ti 发 出 一 个 请 求 ， 它 与 活动 事务 T: 的 操作 冲突 ， 若 TS(CT)<TS(T:)， 就 异常 中 止 T;， 否 则 

(ET, StF, ABT Aik. 

异常 中 止 T 被 称 作 是 kill， 因 为 T 杀 死 了 To. 

a. 试 证 明 Kil-Wait 按 提交 顺序 串 行 化 。 

b. 试 给 出 一 个 由 Kill-Wait 控 制 产生 的 调度 ， 它 不 是 按时 间 改 顺序 可 串 行 化 的 。 

c. 试 解释 为 什么 在 Kill-Wait 控 制 中 不 会 发 生死 锁 。 

Wait-Die 并 发 控制 是 另 一 种 控制 ， 它 结合 立即 更 新 并 发 控制 和 时 间 葵 顺序 控制 : 

如 果 事 务 T 的 请 求 与 活动 事务 T: 的 操作 冲突 ， 若 TSCT)<TS(T)， 则 让 Ti, 等 待 直 到 T; 终 止 ， 否 则 异 

常 中 止 Ti。 

这 里 异常 中 止 Ti 被 称 作 是 die， 因 为 T 杀 死 了 它 自 己 。 

a. 试 证 明 Wait-Die 控 制 是 按 提 交 顺 序 串 行 化 的 ,并 且 能 防止 死 锁 的 发 生 。 

b. 试 比较 执行 Kill-Wait 和 Wait-Die 控 制 的 优点 。 

为 并 行 验证 乐观 并 发 控制 给 出 一 个 完整 的 算法 描述 。 

比较 事务 处 理 系统 的 两 个 模型 : ; 

a 供 套 模型 ， 和 书 中 描述 的 类 似 ， 只 是 不 允许 子 事务 的 并 发 执行 。 在 某 一 时 刻 ， 父 事务 只 有 唯一 
的 一 个 子 事务 在 执行 。 

b. 常规 事务 模型 ， 当 手套 模型 中 的 父 事务 调用 孩子 事务 时 ， 常 规模 型 则 调用 一 个 子 例 程 ， 贝 套 事 
务 模型 中 的 子 事务 异常 中 止 时 ， 常 规模 型 中 相应 的 子 例 程 手 工 撤销 任何 数据 库 的 更 新 ， 并 返回 
一 个 失败 的 状态 。 

解释 为 什么 嵌 套 模型 更 加 有 效 ， 它 能 允许 事务 更 多 的 吞吐 量 。 

假设 事务 Ti 和 T? 能 分 解 成 下 面 的 子 事务 ，T: Tuas TfT: Thy, Too, XET FUT: BE 

FAST ANT 2 ARRAPAR. ARR ERT A RT AUT A ET BE, (ES 
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23.37 


23,38 


并 发 控制 可 以 保证 Ti 总 是 与 Ty, 申 行 执行 ，Tz 总 是 与 Ts 品行 执行 。 

a. Tl 总 是 和 Ts 串 行 执行 吗 ?请 说 明 原因 。 

b. 为 保证 Ti 和 T: 并 发 执行 的 结果 与 串 行 调度 的 执行 结果 一 样 ， 子 事务 上 最 低 的 限制 条 件 是 什么 ? 
c. 假设 保持 b 的 限制 条 件 ， 在 保证 可 串 行 化 调度 方面 ， 和 并 发 控制 相 比 ， 新 的 并 发 控制 有 什么 
优点 ? 

假设 事务 Ti 和 T: 能 分 解 成 下 面 的 子 事务 ，T: Ti，Tiz 和 T2: T,,，T,，， 这 样 每 一 个 子 事务 都 保 
持 数据 库 的 一 致 性 约束 。 不 保证 所 有 涉及 Ti 和 T2 的 调度 是 可 串 行 化 的 ， 假 设 并 发 控制 保证 所 有 的 
子 事务 总 是 可 串 行 化 执行 的 。 

a. 了 总 是 和 T: 串 行 执行 的 吗 ? 请 说 明 原 因 。 

b. 所 有 可 能 的 调度 都 将 保持 完整 性 约束 吗 ? 

c. 如 果 并 发 控制 以 这 样 的 方式 调度 事务 ， 可 能 出 现 什么 样 的 问题 ? 

试 举 出 一 个 调度 的 例子 ， 它 被 两 段 锁 并 发 控制 支持 ， 但 不 被 时 间 惟 顺序 并 发 控制 所 支持 。 





第 24 章 关系 数据 库 中 的 隔离 性 


24.1 加 锁 


迄今 为 止 ， 在 有 关 隔 离 性 的 讨论 中 ， 我 们 总 是 假设 事务 是 通过 名 字 显 式 地 访问 数据 项 的 。 
在 关系 型 环境 里 ， 事 务 所 访问 与 描述 的 都 是 元 组 ; 它 要 求 利用 该 元 组 所 满足 的 条 件 ， 而 不 是 
通过 给 出 其 名 字 ,， 来 隐 式 地 访问 元 组 。 因 此 ，SELECT 语 句 读 取 的 元 组 集合 满足 WHERE 子 名 
中 的 选择 条 件 。 。 

在 某 银行 系统 中 ， 考 虑 对 于 每 个 不 同 账户 都 包含 有 一 个 元 组 的 表 AccouNTs。 我 们 可 以 利 
用 下 述 SELECT 语 句 来 读 取 描 述 由 储户 Mary 控 制 的 AccouNTs 中 的 所 有 元 组 : 


SELECT * =o 

FROM ACCOUNTS A 

WHERE A.Name = ‘Mary' 

上 述 WHERE 子 句 中 的 表达 式 称 为 读 调 词 (read predicate )，FROM 子 句 中 命名 的 表 的 属性 
作为 该 谓词 的 变量 )， 该 语句 返回 ( 读 取 ) 满足 该 读 谓 词 的 所 有 元 组 。 

这 类 操作 的 其 他 形式 将 会 产生 矛盾 。 例 如， 假设 表 AccouNTs 具 有 属性 AcctNumber ( 键 )、 
Name 和 Balance。 同 时 假设 存在 表 DEpPosITORs ， 对 于 每 个 储户 都 包含 一 个 元 组 ， 它 具有 属性 
Name ($) 和 TotalBalance， 其 中 属性 TotalBalance 的 值 是 该 储户 所 有 账户 的 余额 之 总 和 。 为 
Mary 执 行 的 某 个 审计 事务 T! 可 能 需要 执行 下 述 SELECT 语 句 : 

SELECT SUM (Balance) 

FROM ACCOUNTS A 

WHERE A.Name = 'Mary' 

并 将 其 同 执行 下 列 语句 得 到 的 结果 值 进行 比较 : 

SELECT D.TotalBalance 


FROM DEPOSsITORS D 
WHERE D.Name = 'Mary' 


最 后 再 检查 TotalBalance 的 值 是 否 等 于 其 总 和 。 
同时 ，Mary 的 某 个 新 的 账户 事务 Tz 可 能 会 通过 下 述 语句 对 表 AccouNTs 追 加 其 个 新 的 元 组 : 


INSERT INTO ACCOUNTS 
VALUES ('10021', 'Mary', 100) 


然后 利用 下 述 语句 将 表 DEposIroRs 中 相应 的 元 组 的 TotalBalance 增 加 100。 


O 对 于 事务 是 通过 其 主键 (例如 关系 SrupENT 里 的 Id) 访问 元 组 的 特殊 情况 ， 我 们 可 以 将 此 主键 的 值 称 为 该 
元 组 的 名 字 ， 并 且 可 以 考虑 在 该 名 字 的 基础 上 对 元 组 加 锁 。 然 而 ， 正 如 我 们 将 会 看 到 的 ， 即 便 在 这 样 的 特 
殊 场合 ， 也 还 是 需要 应 用 附加 条 件 的 。 
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UPDATE DEPOSITORS 
SET TotalBalance = TotalBalance + 100 
WHERE Name = '‘Mary' 


表 AccouNTS 上 由 Ti 和 T: 所 完成 的 操作 是 相互 冲突 的 ， 因 为 Tz 的 INSERT 和 Ti 的 SELECT 是 
不 可 交换 的 。 倘 若 INSERT 是 在 SELECT 之 前 执行 的 ， 那 么 插入 后 的 元 组 将 由 SELECT 语句 返 
Fl; 反之 ， 则 不 会 被 返回 。 因 此 ， 倘 若 在 Ti 读 取 表 AccouNTSs 和 T2? 读 取 表 DEPoSsITORS 之 间 ， 人 多 
许 T: 交 错 执行 ， 那 么 就 会 得 到 无 效 结果 。 第 2 个 语句 里 由 Ti 所 读 取 的 TotalBalance 之 值 就 不 会 
等 于 它 在 第 1 个 语句 里 读 取 到 的 Balance 的 总 和 。( 表 DEPOsSITORS 上 的 操作 也 有 类 似 的 冲突 。) 


24.1.1 幻影 


就 像 使 用 非 关 系数 据 库 一 样 ， 通 过 应 用 某 个 加 锁 算法 ， 我 们 可 以 确保 实现 可 串 行 化 。 在 
设计 这 类 算法 时 ， 我 们 首先 必须 判断 对 什么 加 锁 。 一 种 做 法 是 对 表 加 锁 。 表 都 有 名 字 ， 并 在 
访问 表 的 读 写 语句 中 使 用 这 些 名 字 。SELECT 语 名 可 以 处 理 成 对 FROM 子 句 中 命名 的 数据 项 
(R) 的 读 取 ， 而 DELETE、INSERT 和 UPDATE 语 句 也 可 以 处 理 成 对 已 命名 的 表 的 写 。 因 此 ， 
在 第 23 章 里 所 描述 的 并 发 性 控制 算法 就 可 以 用 来 实现 可 串 行 化 调度 。 就 像 采 用 页 加 锁 一 样 ， 
可 以 采用 表 加 锁 。 这 种 方法 的 问题 是 ， 加 锁 粒 度 太 粗 。 一 张 表 可 能 会 包含 成 于 上 万 (HEJL 
百 万 ) 个 元 组 。 仅 仅 因 为 要 访问 其 中 某 一 个 元 组 ， 就 对 整个 表 加 锁 ， 这 样 将 会 导致 严重 的 并 
发 性 损失 。 

如 果 不 对 表 加 锁 ， 而 是 对 每 个 元 组 分 别 加 锁 ， 那 么 锁 的 粒度 是 细 了 ， 但 其 最 终 的 调度 可 
能 不 是 可 串 行 化 的 。 例 如 ,假设 Ti 对 AccouNTs 已 读 取 的 所 有 元 组 (满足 谓词 Name = 'Mary' 的 
元 组 ) 加 锁 。 而 一 个 事务 在 某 张 表 中 播 和 新 元 组 的 能 力 是 不 会 受到 其 他 事务 对 该 表 的 现 有 元 
组 所 加 之 锁 的 影响 的 。 因 此 ，T: 可 以 构造 一 个 元 组 (， 它 满足 该 谓词 ， 而 且 描 述 了 Mary 的 一 个 
新 账户 ， 并 将 它 插入 AccouNTs 中 。 这 样 一 来 ， 就 有 可 能 会 产生 下 述 调度 : 

T} 加 锁 并 读 取 AccouNTs 中 描述 Mary 的 账户 的 所 有 元 组 。 

T; 向 AccouNTS 追 加 t， 并 对 其 加 锁 。 

T; 对 Mary 在 DEPOSITORS 中 的 所 有 元 组 加 锁 并 更 新 。 

T, 提 交 并 释放 其 拥有 的 全 部 锁 。 

TI 对 DEPOsITORS 中 的 Mary 的 元 组 加 锁 并 读 取 。 

其 中 ， 由 于 追加 了 t， 因 此 Ts 已 改变 了 谓词 Name = "Mary' 所 引用 的 元 组 集 的 内 容 。 在 这 种 
情况 下 ，t 称 为 幻影 (Phantom ) ， 因 为 Ti 认为 它 锁 住 了 满足 该 谓词 的 所 有 元 组 ， 可 是 Ti 不 知道 
并 发 事务 插入 了 一 个 满足 该 谓词 的 新 元 组 (。 幻 影 可 能 会 导致 非 可 串 行 化 的 调度 ， 因 此 会 产生 
不 确定 的 结果 。 在 本 例 中 ，T, 在 其 第 2 个 语句 里 读 取 到 的 TotalBalance 的 值 不 等 于 其 在 第 1 个 语 
句 里 读 到 的 元 组 的 Balance 属 性 值 的 总 和 。 

出 现 问 题 的 原因 是 SELECT 语句 并 不 命名 特定 的 数据 项 。 相 反 ， 它 指定 一 个 可 能 由 一 些 元 
组 满足 的 条 件 或 谓词 ， 这 些 元 组 有 的 也 许 就 在 某 个 特定 表 里 ， 而 有 的 可 能 不 在 。 然 而 ， 我 们 
只 能 对 已 经 在 某 个 表 里 的 元 组 设置 锁 ， 却 难以 对 不 在 表 里 的 那些 元 组 设置 锁 。 为 了 消除 产生 
幻影 的 可 能 性 ， 我 们 需要 有 一 种 加 锁 机 制 ， 得 以 防止 将 那些 满足 谓词 、 但 当前 并 不 在 表 里 的 
元 组 〈 即 幻影 ) 添加 到 表 里 来 。 | 
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虽然 我 们 以 SELECT 语句 为 例 说 明 幻影 问题 ， 但 只 要 是 对 数据 库 更 新 的 语句 ， 都 可 能 出 现 
这 个 问题 。 例 如 ， 对 满足 谓词 P 的 所 有 元 组 进行 更 新 的 UPDATE 语 句 ， 不 能 和 向 该 表 里 插 人 满 
足 P 的 一 个 元 组 的 某 个 INSERT 语 句 交换。 遗憾 的 是 ， 即 使 更 新 事务 要 求 对 所 有 被 更 新 的 元 组 
加 锁 ， 仍 然 可 能 有 某 个 并 发 事务 对 其 进行 插入 。 

防止 幻影 的 一 种 办 法 是 对 整 张 表 加 锁 ， 这 肯定 可 以 防止 包括 幻影 在 内 的 任何 新 的 元 组 被 
插 人 。 然 而 ， 正 如 在 24.3.1 节 将 会 看 到 的 ， 由 于 存在 可 以 防止 幻影 、 但 不 要 求 对 整 张 表 进 行 加 
锁 的 协议 ， 因 此 对 表 加 锁 并 非 总 是 必要 的 。 所 以 ， 当 许多 商用 DBMS 使 用 术语 “元 组 加 锁 " 
(或 “页 加 锁 ” ) 来 描述 并 发 性 控制 算法 时 ， 意 味 着 它们 采用 元 组 锁 (或 页 面 锁 ) 来 作为 这 类 
协议 的 一 部 分 ， 从 而 保证 可 串 行 性 。 不 过 万 事 小 心 为 妙 ,“ 当 一 切 努 力 均 告 失败 时 ， 请 阅读 用 
户 手册 ”。 但 在 一 些 场合 下 ， 商 用 DBMS 还 是 会 锁 住 整 张 表 ， 以 防止 幻影 并 实现 可 品行 化 。 


24.1.2 谓词 加 锁 


处 理 幻 影 的 一 种 技术 是 谓词 加 锁 (predicate locking) [Eswaran et al. 1976]。 一 个 谓词 P 指 
定 了 元 组 的 一 个 集合 。 当 且 仅 当 某 元 组 的 属性 值 使 P 为 真 时 ， 该 元 组 属于 该 集合 。 例 如 ， 
Name = 'Mary' 是 一 个 谓词 ， 它 指定 AccouNTs 里 存在 的 、 其 Name 属 性 具有 值 Mary 的 所 有 可 能 
元 组 的 集合 。 这 个 集合 是 所 有 曾经 存放 在 AccouNTs 里 的 元 组 集 D 的 一 个 子 集 。 因 此 ，P 指 定 D 
的 一 个 子 集 ， 其 中 有 些 元 素 可 能 在 AccouNTs 里 ， 而 有 些 则 未 必 在 AccouNTs 里 。 

1. 和 SQL 语 句 有 关 的 谓词 

每 个 SQL 语 句 都 有 一 个 相关 的 谓词 。 与 SELECT 或 DELETE 语 句 相 关 的 谓词 是 在 其 
WHERE 子 句 里 指定 的 。 在 最 简单 情况 下 ， 该 子 句 描述 了 对 FROM 子 名 中 命名 的 表 的 属性 的 约 
束 ， 而 该 谓词 则 能 够 与 此 表 相 关联 。 然 而 ， 事 情 有 时 候 会 变 得 更 为 复杂 ， 比 如 ，WHERE 子 句 
中 包含 某 个 册 套 的 SELECT， 或 者 命名 多 张 表 的 FROM 子 句 时 。 在 这 种 情况 下 ， 就 会 涉及 多 张 
表 ， 每 张 表 都 有 一 个 相关 的 谓词 。 尽 管 可 以 将 这 种 情况 描述 得 更 具 一 般 性 ， 但 是 我 们 并 不 打 
算 将 讨论 搞 得 复杂 化 ， 因 为 我 们 当前 的 主要 目的 是 描述 谓词 加 锁 的 概念 。 

与 INSERT 语 句 相 关 的 谓词 描述 了 打算 插 人 的 元 组 集 。 最 简单 的 情况 就 是 插入 单个 元 组 ， 
谓词 是 

(Ai=vi) A (A, =v2) 和 人 人 … A (A, = Va) 

其 中 A 是 第 ;个 属性 的 名 字 ， 而 v 则 是 打算 插入 的 元 里 该 属性 的 值 。 该 谓词 指定 了 已 被 插入 的 
元 组 的 集合 。 更 一 般 地 ，INSERT 可 以 包含 某 个 嵌 套 的 SELECT 语句 

INSERT INTO TasIE1I(' .属性 列表 .……… ) 


SELECT .。 “属性 列表 on 
FROM TABLE2 
WHERE P 


这 时 ， 谓 词 P 既 与 TABLE2 相 关 (因为 满足 P 的 元 组 是 从 该 表 读 取 的 )， 又 与 TABLE1 相 关 (AA 
满足 P 的 元 组 要 写 入 此 表 )。 

一 个 UPDATE 语 名 可 以 看 成 是 一 个 DELETE 语 句 ， 再 跟随 一 个 INSERT 语 句 ， 因 此 ， 它 具 
有 两 个 相关 谓词 。 第 1 个 是 UPDATE 语 句 里 WHERE 子 句 中 的 谓词 P， 它 指定 了 需要 删除 的 元 组 。 
SET 子 句 描述 了 如 何 修改 这 些 元 组 。 然 后 ， 再 插入 由 某 个 谓词 P 所 描述 的 最 终 的 元 组 集 。 例 如 ， 
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下 述 UPDATE 语 句 对 Mary 的 所 有 账户 加 入 利息 : 


UPDATE ACCOUNTS 
SET Balance = Balance * 1.05 
WHERE Name = 'Mary' 


这 种 情况 下 ， 要 删除 的 元 组 和 被 插入 的 元 组 满足 相同 的 谓词 一 -Name = 'Mary', Wii, #4 
Mary 想 要 在 其 名 字 里 加 上 她 的 姓 ， 我 们 可 以 执行 以 下 的 语句 : 


UPDATE ACCOUNTS 
SET Name = 'Mary S' 
WHERE Name = 'Mary' 


现在 ，P 是 Name = 'Mary'， 而 P 则 是 Name = 'Mary S'。 

2. 谓词 锁 

谓词 锁 (predicate lock) 是 加 在 谓词 P 上 与 表 R 相 关 的 锁 ， 它 锁定 由 P 所 指定 的 所 有 元 组 ， 
无 论 它们 是 否 在 表 R 内 。 如 图 24-1 所 示 ，SELECT 语 名 在 FROM 子 句 中 指定 表 R， 并 在 WHERE 
子 句 中 指定 谓词 P。 表 R 内 所 有 的 元 组 ， 凡 满足 P 者 ， 皆 由 该 SELECT 语句 返回 ， 但 是 ，D 中 的 
所 有 元 组 ， 凡 满足 P 者 都 被 锁定 。 


所 有 可 能 元 组 的 集合 D 






通过 读 返 回 的 元 组 


图 24-1 读 谓词 P 指 定 了 D 的 一 个 子 集 。 该 子 集中 的 元 组 有 些 在 R 里 ， 有 些 可 能 不 在 


类 似 地 ， 对 于 DELETE 语 句 ，D 中 的 所 有 元 组 ， 凡 满足 P 者 皆 被 锁定 ， 而 R 中 满足 P 的 元 组 
则 被 删除 。 在 使 用 INSERT 语 句 的 情况 下 ， 锁 住 的 是 所 插入 的 元 组 。 例 如 ， 与 所 插入 元 组 t 
( 它 描述 Mary 在 AccouNTs 里 的 新 账户 ) 相关 的 谓词 锁 恰 好 锁 住 元 组 t。 

Pi:(AcctNumber = '10021') A (Name = 'Mary') A (Balance = 100) (24.1) 
使 用 UPDATE 语 句 ，P 和 P' 两 者 都 必须 加 锁 。 

现在 我 们 来 解释 一 下 更 一 般 的 冲突 的 概念 。 取代 冲突 操作 命名 着 相同 的 数据 项 之 要 求 ， 
现在 我 们 规定 如 下 : 


两 个 操作 冲突 的 条 件 如 下 : 其 中 至 少 有 一 个 是 写 操作 ， 并 且 与 这 两 个 操作 相关 的 谓 
词 所 描述 的 元 组 集 具有 非 空 的 交集 


例如 ， 返 回 所 有 满足 谓词 Name = 'Mary' 的 元 组 的 SELECT(read) 语 句 与 DELETE(write) 语 句 冲 突 : 


DELETE 
FROM ACCOUNTS 
WHERE Balance < 1 
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后 者 删除 所 有 满足 谓词 Balance < 1 的 账户 。 因 为 D 中 存在 同时 满足 两 个 谓词 的 元 组 ， 例 如 ， 满 
足下 述 要 求 的 元 组 : 


AcctNumber = '10000' 人 Name = 'Mary' A Balance=.5 
这 些 元 组 有 可 能 在 AccouNTSs 里 ， 因 此 ， 我 们 无 法 确定 该 SELECT 语句 与 DELETE 语 句 有 
无 交集 。 另 一 方面 ， 该 SELECT 语 名 与 下 述 语 句 并 不 冲突 : 


DELETE 
FROM ACCOUNTS 
WHERE Name = 'John' 


因为 与 这 两 个 语句 相关 的 谓词 的 交集 为 空 集 。 最 后 ， 下 述 语 名 


SELECT * 
FROM ACCOUNTS 
WHERE Name = 'Mary S' 


与 向 其 在 AccouNTs 里 的 Name 属 性 添加 Mary 的 姓 的 UPDATE 语 句 相 冲突 。 

前 面 我 们 已 经 讲 过 ， 谓 词 加 锁 能 解决 幻影 问题 。 当 Ti 读 取 AccouNTs 时 ， 它 对 于 谓词 
Name = 'Mary 施加 一 个 读 取 锁 。 后 来 ， 当 T 试 图 向 AccouNTs 插 入 描述 Mary 新 账户 的 元 组 t 时 ， 
它 将 请 求 对 于 谓词 P. (24.1) 施 加 某 个 写 锁 。 由 于 这 两 个 谓词 的 交集 非 空 ， 因 此 存在 冲突 ， 因 而 
该 写 锁 无 法 获得 授权 。 元 组 t 是 一 个 幻影 ( 它 在 AccouNTs 里 并 不 存在 )， 对 P. 施 加 谓词 锁 防 止 
了 出 现 并 发 性 的 追加 。 , | 

谓词 加 锁 的 一 种 实现 方式 如 下 : 对 于 每 张 表 R ， 都 有 一 个 相关 的 锁 集 L(R)， 其 中 包括 所 有 
获得 授权 的 当前 活动 事务 已 请 求 的 相关 锁 。L(R) 的 每 一 个 元 素 都 对 应 一 个 谓词 。 当 与 某 个 数 
据 库 操作 所 请 求 的 相关 锁 同 L(R) 的 某 一 个 元 素 起 冲突 时 ， 并 发 控制 就 会 让 该 请 求 事务 等 待 。 

利用 谓词 加 锁 ， 我 们 就 能 用 比 表 加 锁 更 为 精细 的 加 锁 粒 度 来 保障 可 串 行 调 度 ， 因 为 我 们 
是 对 可 能 在 R 内 的 、 而 非 整 个 表 内 的 元 组 的 集 的 子 集 加 锁 。 遗 憾 的 是 ， 冲 突 的 测试 (谓词 交集 ) 
实现 起 来 比较 费事 ， 它 限制 了 谓词 加 锁 的 实用 性 。 由 于 这 个 原因 ， 商 用 的 DBMS 一 般 并 不 实 
现 谓词 锁 。 


24.2 加 锁 与 SQL 隔离 级 别 


大 多 数 商用 DBMS 通 过 对 整个 表 加 锁 ， 或 者 利用 与 索引 加 锁 有 关 的 粒度 更 细 的 锁 (我 们 
稍 后 将 会 描述 ) 来 保障 可 串 行 性 。 遗 憾 的 是 ， 对 于 某 些 应 用 来 说 ， 更 富有 刺激 性 的 是 ， 比 实 
现 可 串 行 性 ， 更 快 地 释放 锁 ， 对 此 ， 以 上 两 种 处 理 都 不 太 适 宜 。 

如 果 采 用 较 弱 的 隔离 级 别 [Gray et al. 1976] ， 较 快 地 释放 锁 是 有 可 能 的 。 正 如 我 们 在 
10.2.3 节 看 到 的 ，SQL 标 准 定义 了 四 种 隔离 级 别 ， 每 个 事务 可 以 选取 四 个 级 别 中 的 一 个 。 按 照 
强度 递 降 的 顺序 ， 它 们 是 : 

* SERIALIZABLE (可 串 行 级 ) 

* REPEATABLE READ (可 重复 读 取 级 ) 

* READ COMMITTED ( 读 取 已 提交 级 ) 

。READ UNCOMMITTED ( 读 取 未 提交 级 ) 

SERIALIZABLE 级 是 与 本 书 讨论 的 可 串 行 化 执行 的 概念 相对 应 的 ， 它 是 唯一 能 够 保证 所 
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有 应 用 的 正确 性 的 一 种 隔离 级 别 。 利 用 较 弱 的 隔离 级 别 来 实现 性 能 上 的 提高 ， 是 以 不 正确 执 
行为 代价 的 。 
给 定 的 某 个 DBMS 未 必 支 持 所 有 的 隔离 级 别 。 通 常 是 提供 某 个 特定 级 别 作 为 默认 值 ， 并 
有 请 求 获得 其 他 支持 的 级 别 的 机 制 。 
SQL 标准 [SQL 1992] 根 据 每 个 级 别 应 防止 的 一 定 现象 (有 时 称 为 异常 ) 来 指定 隔离 级 别 ， 
但 SERIALIZABLE 级 是 例外 。 某 个 现象 若是 某 一 级 别 所 防止 的 ， 那 么 它 也 是 更 高 级 别 所 防 
止 的 。 
。 在 READ UNCOMMITTED 级 ， 脏 读 是 有 可 能 的 〈 参 见 23.2 节 )。 
。 在 READ COMMITTED 级 ， 脏 读 是 禁止 的 ， 但 特定 事务 对 同一 个 元 组 连续 读 取 有 可 能 会 
产生 不 同 的 值 。 
“在 REPEATABLE READ 级 ， 通 过 特定 的 事务 对 同一 个 元 组 连续 读 取 不 可 能 会 产生 不 同 
的 值 ， 但 是 有 可 能 会 出 现 幻影 。 | 
“在 SERIALIZABLE 级 ， 禁 止 出 现 幻 影 。 事 务 执行 必定 是 可 串 行 化 的 。 
图 24-2 里 汇总 了 允许 及 不 允许 的 各 种 现象 。 









READ COMMITTED 级 别 
REPEATABLE READ 级 别 
SERIALIZABLE 级 别 


图 24-2 每 种 隔离 级 别 允许 与 不 允许 的 现象 


SQL 隔 离 级 别 并 不 处 理 脏 写 ， 正 如 我 们 在 23.2 节 所 看 到 的 ， 出 于 众多 原因 ， 脏 写 是 我 们 不 
希望 遇 到 的 。 尽 管 在 所 有 事务 均 在 SERIALIZABLE 级 运行 的 情况 下 ， 脏 写 是 不 可 能 出 现 的 ， 
然而 SQL 标准 却 并 没有 在 较 低 隔离 级 别 中 明文 加 以 禁止 (当然 ， 在 某 个 特定 的 实现 里 不 允许 
它们 出 现 是 有 可 能 的 )。 请 注意 ， 图 23-9 里 的 调度 解释 了 某 个 脏 写 入 ， 它 并 不 涉及 脏 读 或 不 可 
重复 读 ， 因 此 它 没 有 违反 三 个 较 低 隔离 级 别 的 任何 一 个 的 要 求 。 由 于 级 别 是 根据 某 些 不 希望 
出 现 的 现象 来 定义 的 ， 那 么 人 们 也 许 会 想 ， 若 脏 读 、 不 可 重复 读 和 幻影 都 消除 了 ， 那 么 调度 
一 定 是 可 串 行 化 的 了 。 脏 写 现象 的 存在 说 明 这 个 观点 是 不 正确 的 。 

SQL 标准 规定 ， 同 一 个 应 用 里 的 不 同事 务 可 以 在 不 同 的 隔离 级 别 上 执行 ， 而 每 个 这 类 事务 
都 会 看 到 或 看 不 到 与 其 级 别 相对 应 的 现象 。 例 如 ， 一 个 在 REPEATABLE READ 级 执行 的 事务 
读 取 某 个 元 组 若干 次 ， 它 总 是 得 到 相同 的 值 ， 尽 管 其 他 的 事务 在 另外 的 隔离 级 别 上 执行 。 类 
似 地 ， 一 个 按照 SERIALIZABLE 级 执行 的 事务 ， 它 所 看 到 的 数据 库 视 图 ， 对 于 由 所 有 其 他 事 
务 所 做 出 的 变更 ， 总 是 可 串 行 化 的 ， 完 全 可 以 无 视 这 些 事务 的 隔离 级 。 

1. 隔离 级 别 的 加 锁 实 现 

由 于 SQL 标准 是 通过 行为 来 定义 隔离 级 别 的 ， 所 以 它 并 未 对 并 发 控制 的 实现 作出 约束 。 特 
别 地 ， 该 定义 并 没有 隐 含 地 说 明 并 发 控制 必须 通过 锁 来 实现 。 然 而 ， 锁 确实 形成 了 绝 大 多 数 
并 发 控制 的 基础 ， 因 此 ， 考 察 一 下 在 基于 锁 的 系统 里 如 何 支 持 SQL 隔离 级 别 ， 是 很 有 用 处 的 。 
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我 们 所 描述 的 实现 是 在 [Berenson et al. 1995] 里 提出 的 9。 

扳 开 隔离 级 别 不 说 ，DBMS 一 般 总 是 保证 每 个 SQL 语 句 能 够 原子 性 地 执行 ， 而 且 这 种 执行 
是 与 其 他 语句 的 执行 相 分 离 的 。 加 锁 功能 比 控制 不 同事 务 的 语句 交合 的 方法 的 强度 更 高 。 

各 个 隔离 级 别 都 是 采用 不 同 的 办 法 加 锁 来 实现 的 。 因 此 ， 一 个 锁 既 可 以 是 对 某 个 项 (元 
组 、 页 或 表 ) 施加 的 常规 锁 ， 也 可 以 是 某 个 谓词 锁 。 我 们 描述 的 是 采用 谓词 锁 的 实现 ， 虽然 
我 们 已 指出 过 ， 鉴 于 其 复杂 性 ， 一 般 并 不 采用 谓词 锁 实现 。 之 所 以 这 样 使 用 ， 是 出 于 教学 上 
的 考虑 。 这 样 ， 我 们 更 精确 地 谈论 ， 需 要 对 什么 进行 加 锁 。 实 际 的 实现 可 能 是 以 表 锁 取代 谓 
词 锁 ， 或 者 是 采用 其 他 的 技术 (参见 24.3.1 节 )。 

有 的 锁 能 够 一 直 持 有 到 提交 时 刻 ， 我 们 称 这 类 锁 为 长 期 (long duration) 的 ; 而 有 的 锁 可 
能 会 在 该 语句 访问 数据 项 或 者 谓词 之 后 便 释 放 ， 这 类 锁 称 为 短期 (short duration) 的 。 短 期 
锁 不 足以 保证 可 串 行 性 。 然 而 ， 通 过 要 求 一 个 事务 请 求 短期 锁 ， 并 发 控制 能 够 检查 它 是 否 与 
其 他 事务 所 持 有 的 锁 冲 突 ， 一 旦 出 现 冲突 ， 便 强行 要 求 请 求 者 等 待 。 如 果 不 提 出 加 锁 请 求 
(就 像 READ UNCOMMITTED 级 那样 ) ， 就 会 忽视 锁 集 合 里 存在 锁 冲 突 的 情况 。 

所 有 的 隔离 级 别 都 以 同样 的 方式 使 用 写 锁 。 长 期 写 锁 是 施加 在 与 UPDATE、INSERT 和 
DELETE 语 句 相关 的 谓词 上 的 。 

某 个 特定 级 别 的 实现 ， 不 仅 会 排除 相应 的 不 希望 出 现 的 现象 ， 同 时 还 可 能 会 排除 其 他 的 
现象 。 由 于 写 锁 在 任何 隔离 级 别 上 都 是 长 期 的 ， 因 此 ， 脏 写 也 是 所 有 级 别 的 规则 所 排斥 的 。 
通过 某 个 SELECT 语句 获得 的 读 锁 在 各 个 隔离 级 别 上 的 处 理 是 不 一 样 的 。 

e READ UNCOMMITTED 级 ”完成 读 取 ， 无 须 获得 读 锁 。 因 为 读 取 并 不 涉及 加 锁 机 制 ， 

一 个 事务 可 以 对 某 些 数据 项 或 谓词 持 有 写 锁 ， 哪 怕 别 的 事务 正在 读 取 它 们 。 因 此 ， 一 个 
事务 可 能 会 读 取 未 提交 的 ( 脏 ) 数据 。 

e READ COMMITTED 对 SELECT 语 句 所 返回 的 每 个 元 组 t, 获得 短期 读 锁 。 其 结果 是 ， 

与 写 锁 起 冲突 的 都 被 检测 出 来 ， 由 于 写 锁 是 长 期 的 ， 所 以 脏 读 是 不 可 能 发 生 的 。 然 而 ， 
由 于 施加 在 + 上 的 读 锁 在 读 取 完 成 时 便 释放 了 ， 在 某 个 特定 的 事务 里 ， 两 个 相继 执行 的 
同样 是 返回 t 的 SELECT 语句 ， 有 可 能 会 被 另行 执行 的 某 个 其 他 事务 隔 开 ， 而 后 者 或 许 将 
在 更 新 ! 后 提交 。 因 此 ， 返 回 的 t 值 ， 有 可 能 是 不 一 样 的 。 

* REPEATABLE READ 级 ”对 SELECT 语句 所 返回 的 每 个 元 组 t， 获 得 长 期 读 锁 。 其 结果 
是 , 的 不 可 重复 读 是 不 可 能 出 现 的 。 可 是 ， 由 于 与 该 SELECT 语句 相关 的 谓词 设 有 加 锁 ， 
所 以 有 可 能 出 现 幻影 。 

。SERIALIZABLE 级 所 有 的 读 (和 写 ) 锁 都 是 长 期 谓词 锁 ， 因 此 ， 幻影 是 不 可 能 出 现 的 。 
所 有 的 事务 都 是 可 串 行 化 的 。 

图 24- 3 汇总 了 各 个 隔离 级 别 的 读 锁 的 用 法 。 “值得 注意 的 是 ， 由 于 所 有 的 写 锁 都 是 长 期 的 ， 
而 所 有 的 隔离 级 别 除 READ UNCOMMITTED 级 以 外 都 要 求 ， 在 读 取 一 个 数据 项 之 前 先 获得 读 
锁 ， 所 以 级 别 高 于 READ COMMITTED 的 所 有 事务 的 调度 都 是 严格 的 。 

由 于 所 有 的 事务 都 使 用 长 期 谓词 写 锁 ， 所 以 它们 的 写 人 操作 都 是 可 串 行 化 的 。 因 此 ， 一 





加 ”要 知道 ， 尽 管 许 多 DBMS 是 利用 下 述 的 加 锁 协 议 来 实现 隔离 级 别 的 ， 但 还 有 一 些 DBMS 是 使 用 不 同 的 实现 
方法 的 。 在 特定 情况 下 ， 实 现 不 同 ， 展 现 出 的 行为 可 能 也 不 同 。 
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个 在 SERIALIZABLE 级 运行 的 〈 因 此 是 采用 长 期 读 谓 词 锁 的 ) 事务 ， 要 么 能 看 到 由 某 个 并 发 
事务 所 完成 的 全 部 更 新 ， 要 么 一 个 也 看 不 到 。 也 就 是 说 ， 对 于 所 有 其 他 独立 于 其 执行 的 隔离 
级 别 的 事务 来 说 ， 它 是 受到 串 行 化 处 理 的 。 然 而 ， 在 较 低 隔离 级 别 执行 的 事务 就 不 一 定 能 看 
到 一 致 的 状态 ， 因 此 ， 它 们 的 更 新 可 能 会 造成 不 一 致 。SERIALIZABLE 级 事务 一 旦 看 到 这 种 
不 一 致 ， 它 们 的 计算 就 会 受到 影响 。 








图 24-3 各 个 隔离 级 别 的 加 锁 实现 中 使 用 的 读 锁 。 所 有 级 别 都 对 谓词 使 用 长 期 写 锁 


较 低 隔离 级 别 所 要 求 的 读 锁 是 弱 于 SERIALIZABLE 级 采用 的 长 期 谓词 读 锁 的 ， 因 此 是 这 
些 级 别 可 以 改善 性 能 的 原因 所 在 。 由 于 各 个 级 别 读 锁 的 管理 消除 了 相应 级 别 所 禁止 的 异常 现 
象 ， 因 此 在 不 同 隔 离 级 别 上 执行 的 事务 能 够 并 发 地 运行 ， 并 满足 各 个 级 别 的 规格 说 明 。 

2. 在 低 隔离 级 别 执行 的 危险 

由 于 允许 事务 在 弱 于 SERIALIZABLE 级 的 级 别 运 行 ， 就 有 可 能 会 产生 不 可 串 行 化 的 调度 。 
因此 ， 一 个 事务 一 旦 看 到 不 一 致 的 数据 ， 它 就 可 能 会 将 不 一 致 的 数据 写 和 数据库。 为 了 说 明 
在 较 低 隔离 级 别 下 这 种 情况 是 如 何 发 生 的 ， 我 们 考虑 如 下 的 例子 。 

(1) READ UNCOMMITTED 级 

在 READ UNCOMMITTED 级 执行 的 某 个 事务 Tz 可 能 会 读 取 到 由 另 一 个 活动 事务 Ti 所 产生 
的 脏 值 。 这 些 值 可 能 从 未 成 为 数据 库 的 真正 组 成 部 分 ， 因 此 是 毫 无 意义 的 。 例 如 ，T, 可 能 向 
某 个 数据 项 写 人 过 一 个 值 v“， 但 后 来 异常 中 止 了 。T2 有 可 能 是 在 Ti 异常 中 止 之 前 读 取 该 数据 项 
的 ， 然 后 向 用 户 返 回 v。 或 者 ，T2? 可 能 在 值 v 的 基础 上 计算 出 某 个 新 值 ， 并 将 其 存 入 另 一 个 数 
据 项 里 。 因 此 ， 由 于 产生 值 v 的 事务 异常 中 止 ， 导 臻 数据库 出 现 混乱 9 。 或 者 ，Ti 可 能 先 将 值 v 
写 人 该 数据 项 ， 然 后 又 用 不 同 的 值 改写 了 值 v。 这 时 ， 对 于 外 部 销 费 来 说 ， 值 v 纯 粹 是 个 没有 
意义 的 中 间 值 。 即 使 T1 只 将 最 终 值 写 入 数据库， 但 车 T; 在 T, 提 交 之 前 看 到 它们 ， 那 么 还 是 有 
可 能 会 产生 不 可 串 行 化 的 调度 。 例 如 ， 图 24-4 中 的 调度 就 是 不 可 串 行 化 的 。 EAH, TER 
行事 务 ， 它 从 余额 保存 在 元 组 ti 里 的 一 个 账户 (初始 为 $1000) 中 取出 $100， 并 将 $100 存 入 余 
额 保存 在 元 组 t 里 的 一 个 账户 (初始 为 $500)。Ts 是 在 READ UNCOMMITTED 级 执行 的 一 个 只 
读 事务 ， 它 打印 所 有 账户 的 总 余额 。 该 调度 表明 ，T:z 读 取 了 一 个 未 提交 的 值 6 ， 因 此 ， 两 个 账 
户 里 正在 传递 着 $100 没 有 得 到 报告 。 

(2) READ COMMITTED 级 

在 READ COMMITTED 级 执行 的 事务 Ti ， 对 各 个 元 组 使 用 的 是 短期 读 锁 。 因 此 ， 如 图 24-5 
所 示 ， 事 务 Ts 可 以 更 新 元 组 :， 然 后 在 T, 的 相继 两 次 读 取 之 间 提 交 。 人 们 可 能 会 认为 这 是 个 严 
重 问 题 ， 因 为 一 个 事务 两 次 读 取 相 同 的 元 组 不 太 可 能 。 然 而 ， 即 便 事务 不 打算 第 2 次 读 取 ， 也 





O ”为 了 防止 数据 库 发 生 混乱 ， 通常 要 求 在 READ UNCOMMITTED 级 运行 的 事务 是 只 读 的 。 
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可 能 会 出 现 不 正确 的 结果 ”。 图 24-6 给 出 了 一 个 调度 的 例子 ， 其 中 Ti 和 T: 都 是 在 READ 
COMMITTED 级 执行 的 银行 存款 事务 ， 它 们 都 在 同一 个 账户 上 操作 ， 该 账户 的 余额 也 全 都 存 
入 元 组 :。 由 于 T! 的 读 锁 是 短期 的 ， 因 此 ， 对 于 Ts 来 说 ， 更 新 t 后 提交 是 不 可 能 的 。 结 果 ，T, 更 
新 的 效果 被 丢失 了 。 值 得 注意 的 是 ， 两 个 事务 读 取 的 都 是 已 提交 的 数据 。 这 就 是 第 2 章 所 介绍 
的 更 新 丢失 的 问题 。 


Tr: r(t, : 1000) w(t, : 900) r(t, : 500) w(t, : 600) 提交 





Tz: r(t, : 900) r(t: 500) ”提交 
图 24-4 涉及 读 取 某 未 提交 数据 的 调度 。T> 在 READ UNCOMMITTED 级 执行 


Tı: r(t: 1000) r(t: 2000) fz 
Ty: w(t: 2000) ”提交 





图 24-5 涉及 不 可 重复 读 的 调度 。T, 在 READ COMMITTED 级 执行 


Ti: r(t: 1000) w(t: 1100) ”提交 


T: r(t : 1000) w(t : 2000) 提交 





图 24-6 说 明 在 READ COMMITTED 级 执行 更 新 会 丢失 的 调度 例子 


图 24-7 给 出 了 在 READ COMMITTED 级 不 正确 调度 的 又 一 个 例子 。 其 中 ， 事 务 Ti 看 到 的 
是 不 一 致 的 数据 库 视图 。 假 设 某 个 完整 性 约束 是 : x 和 y 的 值 必须 满足 x>y， 而 初始 时 x=10， 
?=1。T' 既 读 取 x 也 读 取 》， 但 在 两 次 读 取 之 间 (在 Ti 对 x 已 放弃 读 锁 之 后 ) ， 另 一 个 事务 T: 对 x 和 
y 值 进行 了 修改 〈 以 便 使 新 值 能 满足 完整 性 约束 ) ， 然 后 又 提交 了 。Ti: 看 到 的 x 值 ， 是 在 T: 对 其 
修改 之 前 的 值 ， 而 y 值 则 是 在 Ts 对 其 修改 之 后 的 值 ， 这 个 数据 库 视 图 一 般 是 不 满足 其 完整 性 约 
束 的 。 由 于 事务 只 有 在 看 到 数据 库 的 一 致 性 视图 时 ， 才 能 确保 执行 正确 ， 因 此 Ti 的 执行 方式 
可 能 无 法 预料 ， 也 许 还 会 再 向 数据 库 写 入 错误 的 数据 。 即 便 Ts 在 写 人 时 有 可 能 使 读 取 的 两 个 
值 刚好 满足 完整 性 约束 ， 但 是 鉴于 它们 是 来 自 数据 库 的 两 个 不 同 的 版 本 的 事实 (一 个 是 在 T 
执行 之 前 的 ， 而 另 一 个 是 Ts 执行 之 后 的 )， 就 有 可 能 使 得 T 的 执行 不 正确 ， 并 向 数据 库 写 入 错 
误 的 数据 。 

(3) REPEATABLE READ 级 | | 

由 于 只 是 元 组 (而 非 谓词 ) 具 有 长 期 锁 ， 因 此 ， 幻 影 是 有 可 能 出 现 的 。 我 们 在 24.1.1 节 已 看 
到 ， 这 可 能 会 导致 不 正确 的 行为 。 值 得 注意 的 是 ， 其 中 的 例子 也 涉及 看 到 了 数据 库 的 不 一 致 
的 视图 的 事务 。 i 


24.21 更 新 丢失 、 游 标 稳定 性 和 更 新 锁 
图 24-6 是 更 新 丢失 行为 的 一 个 例子 ， 出 现 该 行为 的 原因 是 在 READ COMMITTED 级 仅仅 
@” 这 是 由 于 《根据 所 防止 的 现象 ) 描述 隔离 级 别 的 方法 的 非 形式 化 特性 造成 不 确定 性 的 一 个 例子 。 是 否 不 可 


重复 读 仅仅 出 现在 一 个 事务 试图 第 2 次 读 ， 并 获得 不 同 的 值 的 时 候 ? 抑或 只 要 试图 第 2 次 读 取 ， 就 会 出 现 不 
可 重复 读 ， 使 其 读 取 到 不 同 的 值 ? 
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应 用 短期 读 锁 。 更 新 丢失 问题 的 一 种 特例 (就 是 读 取 是 通过 游标 来 完成 的 情况 ) 可 以 通过 一 
种 CURSOR STABILITY 级 (游标 稳定 级 ) 的 隔离 级 别 来 防止 更 新 的 丢失 ， 在 许多 SQL 实现 里 ， 
都 用 它 来 代替 READ COMMITTED 级 。 

我 们 尚未 讨论 通过 游标 进行 的 访问 是 如 何 受到 在 不 同 隔离 级 别 执行 的 事务 的 影响 的 。 当 
某 个 事务 Ti 打开 关于 表 R 的 一 个 INSENSITIVE ( 非 敏感 ) 游标 时 ， 就 会 作出 其 结果 集 的 一 份 
拷贝 ,随后 的 通过 游标 而 运行 的 所 有 FETCH 语 句 都 是 用 该 拷贝 完成 的 。 因 此 ， 无 论 Ti 在 哪个 
隔离 级 别 执行 都 不 成 问题 ， 该 FETCH 语 句 决 不 会 看 到 由 某 个 并 发 执行 的 事务 T (甚至 包括 由 
TA) 随后 对 R 作 出 的 任何 更 新 。 

然而 ， 倘 若 Ti 打 开 的 游标 未 声明 为 INSENSITIVE 型 ， 比 如 它 是 KEYSET_DRIVEN (关键 
字 集 驱动 ) 型 的 ， 那 么 便 返 回 一 组 指示 R 上 元 组 的 指针 (结果 集 便 是 根据 R 构 造 的 )， 随 后 的 
”所 有 FETCH 操 作 都 是 通过 指针 作出 的 。 如 果 Ti 在 READ COMMITTED 级 执行 ， 那 么 它 只 要 求 
对 元 组 施加 短期 读 锁 。 如 果 T, 和 Ts 是 并 发 执行 的 ， 那 么 T1 可 以 (在 T, 更 新 之 前 ) 通过 游标 先 取 
回 某 些 元 组 ， 其 他 的 元 组 则 等 待 T2 对 其 更 新 并 提交 之 后 再 取 回 8 。 

特别 地 ，T2z 可 能 会 更 新 一 个 元 组 ， 而 此 时 某 个 游标 正在 指向 它 。 如 果 Ti 先 读 取 该 元 组 ， 
后 来 又 在 移动 游标 之 前 对 它 进行 了 更 新 ， 那 么 这 种 情况 特别 麻烦 。 因 为 在 读 取 和 更 新 之 间 ， 
Ts 可 能 会 读 取 该 元 组 ， 更 新 它 然后 提交 。 在 T 更 新 之 后 ，T; 的 更 新 将 被 丢失 。CURSOR 
STABILITY 级 (游标 稳定 级 ) 可 以 防止 这 一 类 更 新 丢失 。 

CURSOR STABILITY 级 是 READ COMMITTED 级 的 一 种 扩展 。 因 此 ， 它 提供 的 隔离 级 的 
强度 介 于 READ COMMITTED 级 和 REPEATABLE READ 级 之 间 。 使 用 CURSOR STABILITY 
级 ， 只 要 由 事务 Ti 打开 的 游标 指向 某 个 元 组 ， 其 他 事务 T; 就 不 能 修改 或 删除 该 元 组 。 然而 ， 
一 且 了 移动 或 者 关闭 此 游标 ，T: 就 又 可 以 修改 该 元 组 了 。 

正如 在 其 他 隔离 级 中 加 锁 一 样 ，CURSOR STABILITY 级 也 可 以 通过 使 用 长 期 写 谓词 锁 
(或 等 价 物 ) 实现 。 读 锁 的 处 理 如 下 : 


CURSOR STABILITY 应 为 读 取 的 每 个 元 组 施加 短期 读 锁 ， 除 非 该 元 组 是 通过 游标 
访问 的 。 通 过 游标 而 对 元 组 施加 的 读 锁 是 一 种 中 期 (medium-duration ) 锁 ， 它 在 游 
标 指向 元 组 时 获得 ， 在 游标 移动 或 关闭 时 释放 。 

如 果 采 用 CURSOR STABILITY 级 ， 就 有 可 能 出 现 图 24-6 所 示 的 调度 ， 因 为 我 们 隐 式 地 假 
设 Ti 和 T: 都 不 通过 游标 来 引用 t。 然 而 ， 假 设 T 是 向 银行 的 所 有 账户 添加 利息 。 它 通过 一 个 游 
标 不 断 地 访问 各 个 元 组 ， 首 先 读 取 t 的 余额 ， 接 着 就 用 新 的 余额 来 更 新 t。 采 用 CURSOR 
STABILITY 级 ,Ti 对 t 所 获取 的 读 锁 会 一 直 维 持 到 它 请 求 更 新 为 止 。 这 时 ， 该 锁 升 级 为 写 锁 ， 
并 一 直 保 持 到 Ti 提交 为 止 〈 因 为 写 锁 是 长 期 的 )。 因 此 ， 对 于 其 他 事务 T: 来 说 ， 想 在 T, 的 读 取 
和 更 新 之 间 进 行 更 新 是 不 可 能 的 。 


O ”这 里 可 能 会 产生 一些 混淆 ， 因 为 SQL 标 准 要 求 ， 每 个 SQL 语 句 都 应 该 以 原子 性 和 绍 离 性 的 方式 执行 。 在 使 
用 游标 的 情况 下 ，OPEN 和 FETCH 语 句 的 执行 满足 原子 性 和 隔离 性 。 可 是 ， 正 在 取 回 ( 非 INSENSITIVE 型 
游标 的 结果 集 里 的 ) 数据 行 的 事务 T 可 能 会 读 取 到 被 其 他 并 发 事务 更 新 过 的 一 些 数据 行 ， 而 其 他 的 事务 则 
不 会 。 这 时 ， 事 务 T 便 不 满足 隔离 性 ， 它 就 可 能 会 看 到 结果 集 的 不 一 致 的 视图 ， 哪 怕 此 集合 是 由 一 个 满足 
隔离 性 的 OPEN 语 句 创 建 的 也 无 济 于 事 。 
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图 24-7 说 明 在 READ COMMITTED 级 执行 事务 可 能 看 到 
不 一 致 的 数据 库 视图 的 调度 的 例子 


考虑 图 24-8 所 示 的 情况 。 假 设 T? 是 存款 事务 ， 它 直接 通过 一 个 索引 来 访问 t， 并 假定 它 是 
在 READ COMMITTED 级 或 CURSOR STABILITY 级 执行 的 (因为 它们 没有 使 用 游标 时 ， 它 们 
没有 任何 差别 )。T,s 在 T, 读 取 t 之 后 再 读 取 t。 当 T, 请 求 更 新 时， 它 的 读 锁 可 能 已 被 升级 为 写 锁 ， 
因为 T 的 读 锁 是 短期 的 ， 故 而 在 读 到 完成 时 就 被 释放 了 。 遗 憾 的 是 ， 更 新 丢失 问题 并 未 得 到 
解决 。T: 写 人 的 值 (在 Ti 提交 之 后 ) 是 建立 在 其 原先 读 取 到 的 值 ， 而 并 非 是 Ti 写 人 的 新 值 的 
基础 上 的 ， 因 此 ，T 的 更 新 被 丢失 了 。 





Ti: r(t) w(t) 提交 
(通过 游标 ) (通过 游标 ) 


w(t) 提交 


图 24-8 说 明 CURSOR STABILITY 级 并 非 灵 丹 妙药 的 调度 的 例子 


在 我 们 描述 如 何 解决 这 个 问题 之 前 ， 先 考虑 另 一 种 情况 : T: 也 是 在 CURSOR STABILITY 
级 执行 的 ， 并 通过 一 个 游标 来 访问 t。 这 一 次 的 情况 又 很 让 人 失望 ， 因 为 T 和 T: 都 在 读 取 后 持 
有 各 自 的 (中 期 ) 读 锁 ， 当 两 者 都 试图 升级 为 写 锁 时 ， 就 可 能 出 会 现 死 锁 。 很 显然 ， 
CURSOR STABILITY 级 仅仅 提供 了 更 新 丢失 问题 的 部 分 解决 办 法 。 

一 些 商 用 DBMS 为 处 理 这 些 问题 提供 了 若干 补 充 机 制 。 

“在 某 些 系统 里 ， 一 个 事务 T 可 以 在 读 取 数据 项 时 请 求 对 该 数据 项 施加 一 个 写 锁 ， 以 便 使 

得 IT 能够 在 随后 对 数据 项 进行 更 新 。 这 就 避免 了 升级 读 锁 的 要 求 〈 因 此 也 避免 了 死 锁 )， 

可 是 这 样 就 会 拒绝 T 首 次 访问 开始 后 的 其 他 事务 访问 数据 项 ， 哪 怕 这 些 事务 仅仅 只 是 读 

取 数据 而 已 。 . 

。 某 些 系统 提供 一 种 称 为 更 新 锁 (update lock) 的 新 型 锁 ， 事 务 可 以 在 开始 需要 读 取 某 个 

数据 项 ， 随 后 打算 对 其 进行 更 新 的 场合 使 用 它 。。 该 锁 允 许 一 个 事务 读 取 数据 项 但 不 允 

许 写 人 数据 项 ， 并 指明 以 后 它 很 可 能 升级 成 一 个 写 锁 。 更 新 锁 与 其 他 同类 锁 或 写 锁 都 冲 

突 ， 但 与 读 锁 没 有 冲突 。 因 此 ， 倘 若 Ti 和 Ts 都 请 求 更 新 锁 ， 那 么 第 一 个 请 求 的 将 被 批准 ， 

而 另 一 个 请 求 则 需 等 待 。 这 样 ， 丢 失 更 新 和 死 锁 都 得 到 了 避免 。 由 于 更 新 锁 和 读 取 锁 并 

不 冲突 ， 所 以 倘若 Ts 仅仅 要 求 读 取 t， 那 么 它 可 以 在 T 的 读 取 和 写 入 之 间 获 得 某 个 读 锁 ， 

因为 Ti 所 持 有 的 只 是 这 段 时 间 里 的 更 新 锁 。T, 必 须 在 它 打算 写 该 数据 项 之 前 ， 将 更 新 锁 

升级 成 写 锁 。 当 T, 请 求 升 级 时 ， 假 车 正好 有 其 他 事务 持 有 读 锁 ， 那 么 T! 必 须 等 待 。 

° 某 些 系统 提供 一 个 称 为 OPTIMISTIC READ COMMITTED 级 的 READ COMMITTED 

的 版 本 。 如 果 T, 在 这 个 级 别 执行 ， 它 将 获得 与 在 READ COMMITTED 级 执行 时 获得 的 相 

同 的 短期 读 锁 。 然 而 ， 如 果 Ti 后 来 试图 写 人 原先 读 取 过 的 元 组 t 时 ， 有 某 个 别 的 事务 ， 


O ”更 新 锁 有 时 也 称 为 带 写 人 意图 的 读 取 (read-with-intention-to-write) 锁 。 
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在 Ti 读 取 元 组 t 到 试图 写 入 t 的 这 段 时 间 里 曾经 修改 过 t 并 且 提 交 了 ， 那 么 T, 就 将 异常 中 止 。 
这 个 方法 之 所 以 称 为 “乐观 ”， 是 因为 事务 乐观 地 假定 : 各 个 事务 不 必 在 元 组 上 维护 读 
锁 ， 却 仍 可 防止 更 新 的 丢失 9 。 就 像 采 用 其 他 的 乐观 算法 一 样 ， 倘 车 乐观 假设 失败 ， 则 
事务 便 异 常 中 止 。 虽 然 OPTIMISTIC READ COMMITTED 级 别 防止 了 更 新 的 丢失 ,但 是 
它 仍 可 能 导致 不 正确 的 调度 〈( 见 练习 24.17 ) 。 


24.2.2 案例 研究 : 正确 性 各 非 可 串 行 级 调度 一 一 学 生 注册 系统 


虽然 我 们 已 经 给 出 过 在 比 SERIALIZABLE 级 低 的 级 别 上 执行 可 能 会 造成 不 正确 行为 的 例 
子 ， 可 是 往往 可 以 用 一 个 应 用 的 语义 来 说 明 不 正确 行为 是 不 会 发 生 的 ， 或 者 说 没有 任何 严重 
影响 。 在 这 类 应 用 里 ， 事 务 可 以 安全 地 在 低 于 SERIALIZABLE 的 级 别 执行 ， 从 而 具有 较 高 的 
并 发 性 和 良好 的 性 能 。 我 们 假设 DBMS 采 用 本 节 前 面 介绍 的 每 个 级 别 的 加 锁 的 方法 。 

例如 ， 我 们 普 经 谈 到 ， 较 低 隔 离 级 别 允 许 的 非 可 串 行 级 调度 将 会 违反 某 些 完 整 性 约束 。 
然而 ， 回 想 一 下 ， 许 多 种 完整 性 约束 都 能 够 在 数据 库 模式 里 声明 ， 故 而 可 以 由 DBMS 自 动 地 
检查 。 因 此 ， 由 不 完整 的 隔离 级 别 所 造成 的 对 约束 的 破坏 完全 可 以 由 DBMS 检 测 到 ， 而 该 事 
务 (姑且 称 之 为 约束 性 检查 )， 在 其 请 求 提交 时 将 异常 中 止 。 

因此 ， 我 们 现在 假设 ， 大 多 数 完整 性 约束 都 是 在 数据 库 模式 里 声明 的 ， 我 们 现在 必须 讨 
论 的 不 正确 调度 仅仅 包括 : 

。 产 生 未 在 模式 中 声明 的 违反 完整 性 约束 的 数据 库 状态 。 

* 产 生 虽 然 一 致 却 不 正确 的 数据 库 状态 ， 因 为 它们 不 能 反映 事务 的 期 望 结果 。 例 如 ， 由 于 

更 新 丢失 而 产生 的 数据 库 状态 。 

。 返 回 用 户 的 数据 建立 在 不 是 从 蘑 个 一 致 性 快照 所 得 到 的 数据 库 视 图 基础 上 。 比 如 ， 从 某 

个 在 READ UNCOMMITTED 级 执行 的 只 读 型 事务 场合 。 

当 我 们 考虑 某 个 应 用 的 一 个 特定 的 事务 是 否 能 够 安全 地 在 某 个 较 低 隔离 级 别 执行 时 ， 必 
须 弄 清楚 它 与 同一 应 用 里 的 其 他 事务 之 间 的 交互 关系 。 学 生 福 册 系 统 里 的 下 列 事务 则 说 明了 
这 样 的 一 些 可 能 性 ， 该 系统 的 数据 库 模式 在 5.7 节 给 出 。 

(1) READ UNCOMMITTED 级 

考虑 某 个 打印 当前 已 注册 的 某 一 学 生 的 课程 信息 的 事务 Ti。 它 通过 使 用 一 串 FETCH 语 名 
的 某 个 游标 来 读 取 与 该 学 生 Id 相 对 应 的 表 TRANscRIPT 里 的 行 记录 。 这 类 游标 大 多 声明 为 
”INSENSITIVE 型 ， 因 此 ， 一 旦 打开 游标 ， 就 会 获得 与 该 学 生 相 对 应 的 行 记录 的 一 个 快照 。 然 

而 ， 不 正确 调度 问题 依然 会 磁 到 ， 这 与 如 何 声明 游标 无 关 。 

假设 T, 在 READ UNCOMMITTED 级 运行 。 我 们 必须 考虑 它 可 能 会 SHARES TE. 
的 情况 。 下 面 列 出 一 些 这 样 的 情况 : 

“假设 T: 通 过 某 个 UPDATE 语 名 修改 了 表 TRANSCRIPT 里 由 T 读 取 到 的 行 记录 集合 里 的 若干 

字段 。 由 于 任何 SQL 语句 的 执行 都 是 由 DBMS 保 证 隔离 性 的 ， 这 就 保证 了 Ti 所 看 到 的 任 

何 行 3 都 不 会 处 于 因 T, 的 UPDATE 语 名 部 分 执 4 而 导致 的 状态 。T, 所 看 到 的 值 要 么 来 源 于 


O 这 个 方法 有 时 也 称 为 先 提交 者 赢 〈first-committer-wins) 方法 ， 因 为 对 于 写 人 某 个 元 组 的 第 一 个 事务 可 以 
提交 〈 赢 )， 而 第 二 个 试图 对 该 元 组 写 人 的 事务 便 会 异常 中 止 ( 输 )。 我 们 将 在 24.5.3 节 再 深入 讨论 先 提 交 
者 赢 方 法 。 
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T; 的 更 新 出 现 之 前 的 行 记录 快照 ， 要 么 来 源 于 T; 的 更 新 完成 之 后 的 行 记录 快照 。 因 此 ， 

这 样 的 交互 是 不 会 造成 什么 问题 的 。 

。 假 设 T; 通 过 不 同 的 UPDATE 语 句 修 改 了 表 TRANSCRIPT 里 某 一 行 的 若干 字段 。 由 于 处 于 

READ UNCOMMITTED 级 ，T: 既 没 检查 ,也 没 加 锁 ， 所 以 完全 有 可 能 检索 到 被 T 部 分 

地 更 新 过 的 行 的 属性 值 。 这 种 情况 是 不 能 接受 的 , 所 以 我 们 必须 检查 该 系统 的 设计 文档 ， 

断定 没有 任何 事务 是 以 这 种 方式 运行 的 

。 假 设 T, 通 过 不 同 的 UPDATE 语 名 修改 了 天 TRANScRipz 里 的 若干 行 ， 那么 Ti 就 有 可 能 读 取 

到 T: 更 新 之 前 的 行 记录 和 另 一 些 已 被 T? 更 新 过 的 行 记录 。 类 似 地 ， 如 果 T: 通 过 不 同 的 

SQL 语句 插入 或 删除 了 若干 行 记 录 ， 那 么 Ti 也 许 会 报告 某 种 绝 不 可 能 存在 的 状态 。 因 此 ， 

我 们 再 次 必须 确定 ， 在 设计 文档 里 绝 无 任 何事 务 是 以 这 种 方式 运行 的 

"假设 T 更 新 了 某 行 记 录 ， 接 着 Ti 又 在 T: 完 成 之 前 读 取 了 该 行 数据 (一 个 脏 读 )， 可 是 T。 

后 来 却 异常 中 止 了 。 于 是 ，Ti 读 取 的 信息 后 来 进行 了 回 退 。 虽 然 T, 极 少 有 可 能 会 把 这 个 

(已 异常 中 止 的 ) 信息 返回 用 户 ， 但 我 们 也 必须 保证 这 时 没有 产生 严重 的 后 果 。 

如 果 上 述 情况 都 没有 任何 问题 ,Ti 就 可 以 在 READ UNCOMMITTED 级 正确 地 执行 。 结 果 ， 
加 锁 既 不 会 造成 延迟 ， 也 不 会 遇 到 任何 的 延迟 。 

(2) READ COMMITTED 级 

考虑 为 某 个 学 生 注册 一 门 课程 c 的 事务 Ti。 它 是 通过 执行 以 下 的 步骤 实现 的 (其 中 有 些 步 
又 省 略 了 ): 

1) 通过 读 取 表 REQUIRES 确 定 c 的 预备 课程 ， 对 于 每 门 课程 的 每 一 门 预 备课 程 ，REQUIRES 表 
都 有 一 行 记录 。 

2) 通过 读 取 表 TRANSCRIPT， 检 查 该 学 生 应 完成 的 c 的 预备 课程， 以 确定 该 学 生 是 否 已 经 完 
成 每 一 门 预 备课 程 ， 并 获得 过 至 少 为 C 的 成 绩 。 

3) 检查 班级 c 是 否 有 足够 大 的 教室 ， 车 有 ， 便 增加 当 前 注册 人 数 。 为 了 完成 这 项 工作 ，Ti 
执行 如 下 语句 : 


UPDATE CLASS 
SET Enrollment = Enrollment + 1 
WHERE CrsCode = :courseId AND Enrollment < MaxEnrolliment 


其 中 班级 c 的 课程 代码 存放 在 宿主 变量 courseId 里 ， 同 时 ， 我 们 假定 CLASS 包含 属性 Enrollment 
和 MaxEnrollment， 前 者 包含 下 学 期 已 注册 该 课程 的 学 生 数目 ， 而 后 者 则 包含 c 中 最 多 可 以 注 
册 的 人 数 。( 值 得 注意 的 是 ， 这 里 给 出 的 方法 与 12.6.2 节 设计 的 在 模式 中 检查 该 条 件 的 方法 有 
所 不 同 。) 

4) 在 表 TRANSCRIPT 里 插入 一 行 记录 ， 表 示 该 学 生 已 注册 了 班级 c 。 

假设 Ti 是 在 READ COMMITTED 级 执行 的 。 我 们 必须 考虑 以 下 情况 : 

。 当 第 1 步 中 T, 在 利用 行 的 短期 读 锁 读 取 REQUIRES 时 ， 可 能 有 某 个 并 发 的 事务 T; 也 正在 通 

过 插入 与 c 的 预备 课程 相对 应 的 新 的 行 记 录 (包括 这 些 预备 课程 的 通过 日 期 ) 更 新 

REQUIRES， 然 后 提交 。 

为 了 增加 例子 的 趣味 性 ， 我 们 假定 Ti 在 读 取 RaQUrREs 时 采用 DYNAMIC 型 游标 。 如 果 Ti 和 
T: 并 发 地 执行 ， 那 么 Ti 可 以 看 到 一 部 分 〈 但 不 是 全 部 ) 由 Ts 所 插入 的 行 记录 。 因 此 ，T 对 于 TT 
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来 说 就 不 是 可 串 行 化 的 。 

然而 ， 在 这 种 情况 下 ， 不 可 串 行 性 并 不 会 造成 任何 问题 ， 因 为 在 第 3.3 节 曾经 规定 过 ， 不 
对 当前 注册 者 应 用 新 的 预备 课程 。 所 以 ， 在 第 1 步 中 确定 c 的 预备 课程 时 ， 使 用 各 个 预备 课程 
行 的 日 期 属性 的 Ti 忽略 了 那些 在 本 学 期 追加 的 预备 课程 。 因 此 ，T 读 取 到 一 部 分 (而 非 全 部 ) 
由 T: 追 加 的 新 的 预备 课程 时 不 会 有 任何 问题 ， 因 为 不 管 读 到 什么 内 容 ， 它 都 将 其 忽略 的 。 这 
样 一 来 ， Ti 在 READ COMMITTED 级 也 能 够 正确 地 执行 。 

值得 注意 的 是 ， 即 便 Ti 采用 KEYSET_DRIVEN 型 游标 ， 在 READ COMMITTED 级 执行 仍 
然 是 正确 的 ， 因 为 Ti 看 不 到 播 入 的 任何 行 。( 不 过 ， 其 理由 却 令 人 扫兴 ， 它 是 出 于 
KEYSET_DRIVEN 型 游标 的 语义 ， 而 不 是 出 于 该 事务 的 语义 。) 

“在 第 2 步 中 ， 当 Ti 读 取 TRANsSCRIPT， 并 放弃 读 到 的 行 记 录 上 的 短期 读 锁 之 后 ， 某 个 并 发 

事务 T: 可 能 会 通过 改变 该 学 生 某 门 课程 的 成 绩 ， 或 者 追加 该 学 生 尚未 修 读 过 的 某 门 新 课 

程 来 更 新 TRANSCRIPT。 这 一 修改 也 许 会 影响 到 c 的 预备 课程 。Ti 是 看 不 到 这 种 修改 的 影 

响 的 ， 然 而 ， 倘 若 它 在 SERLALIZABLBE 级 运行 的 话 ， 那 么 它 就 要 在 第 2 步 里 对 

TRANSCRIPT 加 上 长 期 谓词 锁 (或 其 等 价 物 ) 。 该 锁 用 于 防止 Tz 在 Ti 完成 之 前 更 新 

TRANSCRIPT。 因 此 ， 在 这 种 情况 下 ，T! 是 不 会 看 到 T; 的 影响 的 ， 所 以 ， 在 这 种 情况 下 ， 

两 个 事务 (T, 和 T,) 都 可 以 在 READ COMMITTED 级 运行 。 

* 可 能 会 发 生 试 图 将 学 生 注册 到 c 里 的 两 个 注册 事务 并 发 执行 的 情况 ， 这 样 会 导致 技 失 更 

新 〈 如 图 24-6 所 示 )。 然 而 ， 在 本 例 中 ， 这 种 更 新 丢失 是 不 会 出 现 的 ， 因 为 第 3 步 中 的 检 

查 和 增加 是 作为 某 个 SQL 语句 的 隔离 执行 的 一 部 分 而 完成 的 (值得 注意 的 是 ， 它 不 必 依 

赖 于 由 长 期 写 锁 提 供 的 保护 机 制 ， 就 能 确保 这 一 点 )。 类 似 的 论据 也 可 以 应 用 到 并 发 执 

行 某 个 注销 事务 的 场合 。 

由 于 这 些 情 况 都 不 会 产生 不 正确 的 调度 ， 所 以 该 注册 事务 能 够 在 READ COMMITTED 级 
正确 运行 。 因 此 ， 在 步骤 1 和 步骤 2 中 所 要 求 的 读 锁 将 很 快 释 放 ， 以 改善 性 能 。 

(3) REPEATABLE READ 级 

在 REPEATABLE READ 级 执行 的 事务 中 ， 唯 一 可 能 出 现 的 不 利 情况 是 由 幻影 引起 的 。 考 
虑 完成 重新 分 配 教 室 的 某 个 事务 。 当 新 学 期 来 临时 ， 学 校 可 能 想 腾 出 大 教室 ， 决 定 把 原先 分 
配 到 大 教室 、 但 注册 人 数 较 少 的 课程 重新 分 配 到 较 小 的 教室 。 新 教室 必须 能 够 容纳 该 课程 当 
前 已 注册 的 学 生 ， 该 课程 的 最 大 允许 注册 人 数 必须 低 于 该 教室 的 所 能 容纳 的 人 数 。 

， 重 新 分 配 教室 事务 Ti 是 在 某 个 特定 时 间 段 里 为 所 有 课程 执行 这 一 功能 的 。 为 此 ， 它 需要 

完成 以 下 步骤 : o 

1) 在 指定 时 间 段 讲授 的 课程 里 ， 标 识 出 满足 条 件 〈 最 大 注册 人 数 超出 其 当前 注册 人 数 达 
某 个 赋值 以 上 ) 的 课程 。 为 了 完成 这 个 任务 ，T 使 用 了 建立 在 下 述 查 询 基础 上 的 游标 : 


SELECT C.CrsCode, C.Enrollment, C.MaxEnrollment, 
C.ClassroomID | 
FROM CLASS C 
WHERE C.ClassTime = :timeSlot 
AND C.MaxEnrollment - C.Enrollment > :thresh 


其 中 时 间 段 和 赋值 分 别 存放 在 宿主 变量 timeSlot 和 thresh 里 。 正 如 5.7 节 一 样 ， 我 们 假定 CLAss 
具有 ClassroomId 和 ClassTime 两 个 属性 ， 前 者 标识 出 下 个 学 期 讲授 该 课程 所 在 的 教室 ， 而 后 者 
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则 规定 该 课程 在 下 个 学 期 将 占用 的 时 间 段 。 

2) 对 步 又 1 所 确定 的 每 门 课程 ， 读 取 表 CLASSROOM 和 CLASS， 以 确定 是 否 存在 更 小 的 教室 
能 够 容纳 当前 已 注册 的 学 生 ， 而 且 在 所 规定 的 时 间 段 里 未 被 占用 。 

3) 对 于 存在 更 小 教室 的 每 门 课程 ， 更 新 CLAss 的 ClassroomId 属 性 ， 以 反映 出 新 的 教室 分 
配 ; 同时 更 新 CLAss 的 MaxEnrollment 属 性 ， 以 反映 新 教室 的 大 小 。 

我 们 首先 观察 到 ， 在 READ COMMITTED 级 ，Ti 是 不 能 正确 执行 的 。 在 第 1 步 中 ，Ti 在 
CLASS 上 施加 的 短期 读 锁 并 不 能 让 注册 事务 防止 在 步 又 1 到 步 又 3 之 间 使 注册 人 数 增加 。 因 此 ， 
可 能 有 些 课程 分 配 到 的 教室 大 小 ， 不 能 容纳 在 册 学 生 。 

现在 假设 Ti 是 在 REPEATABLE READ 级 执行 的 。 我 们 必须 考虑 以 下 三 种 情况 : 

*。T! 完 成 了 第 1 步 之 后 ， 在 所 考虑 的 时 间 段 中 ， 某 个 并 发 的 事务 Ts 可 能 会 在 表 CLASs 里 插入 

与 某 个 新 班级 (幻影 ) 相对 应 的 新 的 行 记 录 。 追 加 这 样 的 新 班级 不 仅 不 太 可 能 ， 而 且 即 
便 发 生 了 ， 也 不 会 对 T 的 目标 造成 太 大 的 影响 。 重 新 给 这 个 新 班级 安排 教室 的 要 求 是 不 
会 被 考虑 的 ， 而 所 有 现 有 的 班级 都 会 得 到 正确 的 处 理 。 此 外 ， 其 效果 也 与 T, 排 在 T, 之 后 
顺序 执行 的 效果 相同 。 l 

。 类 似 地 ，T, 完 成 了 第 2 步 之 后 ， 在 所 考虑 的 时 间 段 中 ， 某 个 并 发 的 事务 Ts 可 能 会 在 表 

CLASSROOM 里 插入 与 某 个 新 教室 (幻影 ) 相对 应 的 新 的 行 记录 。 然 而 ， 追 加 新 的 教室 是 
不 太 可 能 的 ， 也 不 会 对 T 的 目标 造成 太 大 的 影响 。 此 外 ， 其 效果 与 T, 排 在 T, 之 后 顺序 执 
行 的 情况 完全 相同 。 l 
。 由 于 T, 减 少 了 MaxEnrollment， 不 难 想象 ， 它 会 干扰 在 READ COMMITTED 级 执行 的 注册 
事务 的 正确 操作 ， 因 为 该 操作 要 访问 MaxEnrollment， 并 为 某 个 特定 的 课程 c 增 加 
Enrollment。 如 果 两 个 事务 并 发 执行 ， 是 否 有 可 能 最 终 会 处 于 (对 于 某 个 c) MaxEnrollment 
< Enrollment 的 状态 呢 ? 这 是 不 会 的 ， 因 为 唯一 可 能 的 途径 是 ， 该 注册 事务 在 Ti 执行 第 ! 
步 和 第 3 步 之 间 ， 增 加 了 Enrollment。 然 而 ， 这 是 不 可 能 发 生 的 ， 因 为 在 第 1 步 里 ，Ti 就 
已 对 关系 CLASS 里 c 的 行 施 加 了 某 个 (长 期 ) 读 锁 。 

由 于 上 述 情况 都 不 会 造成 不 正确 的 调度 ， 所 以 T 就 可 以 在 REPEATABLE READ 级 运行 ， 
而 不 是 在 SERIALIZABLE 级 运行 。 只 有 Ti 实际 访问 的 那些 页 或 行 ， 才 需要 加 上 读 锁 ， 因 而 ， 
其 性 能 也 得 到 了 改善 。 E 

(4) SERIALIZABLES 

事务 Ti 检查 与 本 学 期 某 门 课程 在 册 生 所 对 应 的 TRANSCRIPT 表 的 行 数 是 否 与 CLASSs 表 中 该 课 
程 的 行 所 记录 的 当前 注册 人 数 相等 。 因 此 ， 对 于 各 门 课 程 来 说 ， 它 完成 以 下 的 步 又 : 

1) 利用 下 述 语 句 ， 对 TRANSCRIPT 里 的 行进 行 计数 ， 以 确定 该 课程 的 在 册 生 人 数 。 

SELECT COUNT(*) 
INTO :registered 
FROM TRANSCRIPT T 


WHERE T.CrsCode = :courseld 
AND T.Semester = :this_sem 


2) 利用 下 述 语句 ， 从 CLAss 的 合适 行 检索 Enrollment 值 ， 以 确定 课程 的 在 册 生 人 数 。 


SELECT C.Enrollment ` 

INTO :enrolled 

FROM CLASS C 

WHERE C.CrsCode = :courseld 
AND C.Semester = :this_sem 
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3) 比较 enrolled 与 registered 。 

Ti 必须 在 SERIALIZABLE 级 执行 。 倘 车 它 在 REPEATABLE READ 级 执行 ， 则 某 个 注册 事 
务 就 可 能 会 在 步骤 1 和 2 之 间 交 叉 。 虽 然 Ti 可 以 对 与 某 门 课程 的 在 册 生 相对 应 的 所 有 行 设置 长 
期 读 锁 ， 但 是 ， 注 册 事 务 可 能 会 为 注册 该 门 课程 的 学 生 插 入 某 个 幻影 行 ， 更 新 该 课程 在 CLAss 
里 的 行 记录 ， 然 后 提交 ， 并 释放 其 爹 部 锁 。 这 样 ， 第 2 步 里 ，T 读 取 到 的 该 课程 的 值 ， 就 不 会 
等 于 它 在 第 1 步 里 所 获得 的 值 。 为 了 防止 出 现 这 种 幻影 , Ti 必须 在 SERIALIZABLE 隔 离 级 运行 。 
值得 注意 的 是 ， 倘 若 将 步骤 1 和 2 颠倒 一 下 ， 那 么 这 种 特殊 的 交互 可 能 就 不 会 发 生 。 

我 们 已 经 给 出 过 若干 个 在 低 于 SERIALIZABLE 隔 离 级 执行 将 产生 不 正确 结果 的 例子 ,而 
其 他 的 例子 则 不 会 产生 不 正确 的 结果 。 对 于 任意 给 定 的 应 用 来 说 ， 一 个 谨慎 的 设计 师 总 是 假 
定 ， 使 用 较 低 的 隔离 级 别 可 能 会 产生 不 正确 的 结果 ， 除 非 已 被 明确 地 告知 ， 根 据 该 应 用 的 语 
义 ， 这 类 结果 是 完全 不 可 能 产生 的 。 

此 外 ， 我 们 注意 到 ， 凡 是 由 于 选择 使 用 较 低 的 隔离 级 别 而 导致 的 错误 都 是 难以 追查 的 。 
它们 往往 出 现在 事务 错误 地 交叉 的 调度 中 。 倘 车 特定 事务 不 常 调用 的 话 ， 就 不 会 经 常 出 现 这 
种 出 错 情况 ， 而 这 种 不 正确 调度 的 后 果 ， 可 能 直到 其 执行 后 的 很 长 一 段 时 间 里 才 会 显现 出 来 。 
正 是 由 于 这 个 缘故 ， 系 统 的 工作 在 很 长 一 段 时 间 里 仿佛 都 很 正常 ， 直 到 有 一 天 突然 检测 到 存 
在 某 个 不 一 致 的 状态 。 要 确定 造成 这 一 错误 的 事件 序列 是 极端 困难 的 。 

从 软件 工程 的 观点 看 ， 还 有 一 些 值 得 注意 的 地 方 。 即 便 一 个 应 用 的 初始 版 本 的 语义 可 以 
保证 在 较 低 的 隔离 级 别 也 只 会 产生 正确 的 调度 ; 但 后 来 的 版 本 的 语义 却 不 能 做 出 这 样 的 保证 ， 
因为 系统 可 能 追加 了 新 的 事务 ， 或 者 修改 了 某 些 旧 的 事务 。 因 此 ， 应 当 仔 细 地 在 文档 (或许 
是 设计 文档 ) 中 记录 在 较 低 隔离 级 别 运行 的 理由 ， 以 便 以 后 让 系统 维护 人 员 判断 对 于 更 新 后 
的 版 本 ， 该 理由 是 否 仍然 有 效 。 

(5) 修订 的 注册 事务 

在 12.6.2 节 里 给 出 的 注册 事务 的 设计 与 这 里 所 描述 的 设计 是 不 一 样 的 ， 前 者 假设 ， 一 个 班 
级 中 能 够 注册 的 学 生 人 数 受到 数据 库 模 式 中 某 个 完整 性 约束 的 限制 。 故 而 ， 在 该 种 设计 里 ， 
两 个 并 发 执行 的 注册 事务 引起 超出 限制 的 情况 ， 也 是 不 可 能 存在 的 〈 不 过 ， 理 由 却 是 不 一 样 
的 )。 因 此 ， 我 们 可 能 会 认为 ， 在 那 种 设计 里 的 注册 事务 在 READ COMMITTED 级 也 可 以 正确 
地 执行 。 

然而 ， 在 12.6.2 节 里 我 们 曾经 考虑 过 某 些 附 加 条 件 ， 这 里 却 还 没有 考虑 到 。 例 如 ， 该 事务 
检查 《在 事务 代码 内 部 ) 注册 不 至 于 造成 某 个 学 生 在 该 学 期 选修 课程 的 总 学 分 超过 20 的 极限 。 
它 通 过 读 取 TRANSCRIPT 来 确定 当前 注册 的 学 生 的 学 分 情况 。 倘 若 该 约束 得 到 满足 ， 它 就 在 
TRANSCRIPT 里 插入 一 个 与 新 课程 相对 应 的 新 的 元 组 。 

如 果 该 事务 在 READ COMMITTED 级 (或 在 REPEATABLE READ 级 ) 执行 ， 就 有 可 能 存 
在 学 生 学 分 超过 极限 的 情况 。 倘 若 该 学 生 启动 了 两 个 并 发 的 注册 事务 ， 以 注册 两 门 不 同 的 课 
程 ， 但 这 两 个 事务 都 没有 看 到 对 方 插入 TRANSCRIPT 里 的 〈 幻 影 ) 元 组 ， 它们 又 都 提交 了 ， 结 
果 ， 学 分 的 极限 就 有 可 能 被 超过 。 

也 许 设计 师 觉得 发 生 这 种 情况 的 可 能 性 很 小 ， 该 事务 可 以 安全 地 在 READ COMMITTED 
级 运行 。 若 不 是 ， 该 注册 事务 就 应 当 在 SERIALIZABLE 级 执行 ， 以 便 消除 幻影 。 
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(6) 学 生 注 册 系 统 中 的 死 锁 
现在 考虑 对 于 同一 门 课 程 的 两 个 事务 (注册 事务 Ti 和 注销 注册 事务 T:) 并 发 执行 ， 同 时 
假定 DBMS 采 用 页 加 锁 。 


。T; 首 先 删除 TRANSCRIPT 里 描述 注册 该 课程 的 学 生 的 行 记 录 ，、 然 后 ， 减 少 CLASs 里 的 

Enrollment (因为 车 该 学 生还 没有 实际 注册 的 话 ， 那 么 就 不 存在 让 Enrollment 减 少 的 情 

况 )。 于 是 ，T, 首 先 获得 对 于 TRANSCRIPT 的 某 个 长 期 谓词 写 锁 ， 然 后 获得 对 于 CLASS 的 长 

期 请 词 写 锁 。 尽 管 我 们 还 没有 讨论 过 谓词 锁 的 实现 ， 但 不 妨 假 设 ， 这 两 个 锁 都 是 锁 住 正 

要 更 新 的 页 面 。 . 

“不 妨 回忆 一 下 ， 注 册 事 务 Ti 首先 更 新 CLASS (因为 倘若 该 课程 没有 可 用 的 教室 的 话 ， 那 

么 在 TRANSCRIPT 里 根本 就 不 存在 地 方 让 它 播 和 人 元 组 ) ， 然 后 再 在 TRANSCRIPT 里 插入 一 个 

元 组 。 于是，T! 首 先 获得 对 于 CLASS 的 某 个 长 期 谓词 写 锁 ， 然 后 再 获得 对 于 TRANSCRIPT 

的 长 期 谓词 写 锁 。 我 们 再 一 次 假设 ， 两 个 锁 都 是 锁 住 正 要 更 新 的 页 面 。 

两 个 事务 都 是 更 新 CLASS 里 的 同一 个 元 组 。 如 果 T! 试 图 把 TRANSCRIPT 里 的 新 元 组 插入 到 包 
含 被 T; 删 除 的 元 组 的 页 面 里 ， 就 可 能 产生 死 锁 ， 因 为 处 在 对 立 状态 中 的 T,/ 和 T, 都 想 获 得 各 自 
的 锁 。 由 于 所 有 的 隔离 级 别 都 采用 的 是 长 期 写 锁 ， 所 以 这 个 死 锁 与 选择 的 隔离 级 别 无 关 。 

值得 注意 的 是 ， 两 个 注册 事务 其 实 都 不 会 死 锁 ， 因 为 它们 都 以 相同 的 顺序 要 求 对 两 张 表 
加 锁 : 首先 对 CLAss 加 锁 ， 然 后 对 TRANSCRIPT 加 锁 。 因 此 ， 要 求 事务 按照 相同 的 顺序 对 某 个 项 
加 锁 ， 是 标准 的 避免 死 锁 的 一 种 手段 。 


24.2.3 可 串 行 化 ，SERIALIZABLE 和 正 态 的 


在 抄 述 并 发 控制 所 产生 的 调度 上 时， 我 们 已 经 使 用 过 三 种 术语 : 

。 可 事 行 化 (Serializable) ”等 价 于 某 个 串 行 化 调度 。 - ` 

e SERIALIZABLE% (PETR) ”一 种 SQL 隔离 级 别 。 它 不 允许 脏 读 取 、 不 可 重复 型 读 
取 以 及 幻影 ， 而 且 调 度 必 须 是 可 串 行 化 的 (如 [SQL 1992] 中 的 ANSI 规 格 说 明 所 述 )。 

e ESk (Correct) ”让 数据 库 处 于 一 种 正确 地 模拟 现实 世界 ， 并 且 满 足 企业 的 业务 规则 
(如 同 其 规格 说 明文 档 所 述 ) 的 状态 。 | 
这 些 定义 有 以 下 关系 (假定 每 个 事务 都 是 一 致 的 ): 

。 如 果菜 个 调度 是 可 串 行 化 的 ， 那 么 它 一 定 是 正 态 的 。 

。 如 果 某 个 调度 是 由 一 组 在 SERIALIZABLE 隔 离 级 执行 的 事务 所 产生 的 ， 那 么 它 是 可 串 行 
化 的 (因而 也 是 正 态 的 )。 

上 面 两 个 结论 反 过 来 不 一 定 成 立 。 

。 一 个 调度 可 以 是 正 态 的 ， 即 使 它 不 是 可 串 行 化 的 。 

© 一 个 调度 可 以 是 可 串 行 化 的 ， 即 使 它 是 通过 在 低 于 SERIALIZABLE 隔 离 级 执行 的 事务 所 
产生 的 。 

前 一 节 里 已 经 提供 了 证 明 这 两 个 结论 的 一 些 例子 。 

“ 正 态 的 ， 但 非 可 串 行 化 的 ”注册 事务 可 以 正确 地 在 READ COMMITTED 级 执行 ， 尽管 相 
对 于 追加 新 预备 课程 的 事务 来 说 ， 它 不 是 可 串 行 化 的 。 

“可 串 行 化 的 ， 但 有 些 事务 不 是 SERIALIZABLE 级 的 ”除了 教室 重 分 配 事务 是 在 
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REPEATABLE READ 级 执行 的 以 外 ， 其 他 所 有 事务 都 是 在 SERIALIZABLE 级 执行 的 ， 
这 种 调度 是 可 串 行 化 的 。 这 是 因为 ， 当 教室 重 分 配 事务 IT 正 在 执行 时 ， 某 个 事务 有 可 能 
会 创建 出 幻影 〈 通 过 追加 新 的 教室 或 新 的 课程 )， 该 事务 可 能 实际 上 被 串 行 地 排 在 T 的 后 
面 ， 因 为 T 不 会 看 到 幻影 。 

这 些 例 子 再 一 次 说 明 可 以 获得 正确 性 ， 但 不 一 定 要 通过 严格 的 加 锁 协议 来 保证 串 行 化 调度 。 


24.3 粒度 加 锁 : 概念 锁 和 索引 锁 


在 前 一 节 里 ， 我 们 讨论 了 如 何 通过 使 用 并 不 能 确保 可 串 行 化 执行 的 隔离 级 别 来 改善 事务 
处 理 系统 的 性 能 。 而 加 锁 粒 度 也 同样 可 以 影响 系统 的 性 能 。 在 本 节 里 ， 我 们 考虑 允许 根据 事 
务 的 需要 调整 粒度 的 加 锁 算 法 。 这 样 既 可 以 提高 性 能 ， 又 可 以 保留 可 串 行 化 行为 。 

加 锁 系 统 的 设计 者 在 选择 加 锁 粒 度 时 ， 需 要 在 一 致 性 和 开销 之 间 进 行 权 衡 。 因 此 ， 当 对 
某 个 应 用 程序 (其 中 有 一 个 事务 需要 访问 大 量 的 数据 (比如 ， 整 张 表 )， 而 其 他 的 事务 却 只 访 
问 少 量 的 数据 (比如 ， 几 个 元 组 )) 执行 并 发 控制 时 ， 我 们 希望 使 用 一 种 允许 不 同 粒度 的 加 锁 
机 制 。 

粒度 加 锁 [Gray et al. 1976] 就 是 为 了 满足 这 一 需要 而 设计 的 。 一 个 需要 访问 大 量 数据 的 事 
务 可 以 用 一 个 简单 的 命令 来 给 数据 加 锁 ; 而 一 个 需要 访问 少量 数据 的 事务 可 以 给 每 个 数据 单 
独 的 加 锁 。 在 后 面 的 事务 中 ， 几 个 事务 可 以 同时 在 同一 数据 组 中 对 小 的 数据 项 加 锁 。 

举 一 个 简单 的 例子 ， 一 个 系统 既 可 以 对 多 个 记录 加 锁 ， 也 可 以 仅 对 某 个 记录 里 的 特殊 字 
段 加 锁 。 这 两 种 锁 的 粒度 是 不 同 的 。 假 设 事务 TI 在 记录 Ri 内 对 字段 RE, 施加 了 一 个 写 锁 ， 随 后 
事务 T 需 要 对 于 整个 记录 R, 施 加 一 个 写 锁 。 但 由 于 T> 要 求 访问 字段 FE ， 于 是 后 一 个 写 锁 就 不 能 
被 批准 。 现 在 的 问题 是 ， 需 要 在 申请 对 Ri 加 锁 时 ， 设 计 一 个 有 效 的 机 制 ， 使 并 发 控制 可 以 识 
别 对 F, 加 的 锁 。 . 

解决 的 方法 是 ， 分 层次 地 安排 加 锁 。 在 对 Fi 加 锁 之 前 ，Ti 必 须 首 先 对 R1 加 锁 。 随 后 ， 当 T。 
请 求 对 R, 加 锁 时 ， 并 发 控制 将 会 发 现 冲 突 。 但 是 T! 要 得 到 一 个 什么 类 型 的 锁 呢 ?很 显然 ， 既 
不 是 读 锁 也 不 是 写 锁 ， 因 为 在 这 种 情况 下 没有 必要 对 Fi 追加 粒度 细 的 锁 ， 而 且 有 效 锁 粒度 也 
会 显得 很 粗糙 。 因 此 ，DBMS 提 供 了 一 种 新 型 的 加 锁 方 式 一 一 意向 锁 (intention lock)。 在 一 
个 事务 能 够 对 某 个 数据 项 加 共享 锁 或 排他 锁 之 前 ， 它 必须 在 粒度 的 层次 结构 上 ， 对 所 有 和 需要 
包含 的 数据 项 施加 适当 的 意向 锁 。 于 是 ， 在 TT 可 以 对 Fi 加 锁 之 前 ， 它 必须 首先 对 Ri 施加 意向 
锁 。 意 向 锁 有 三 种 类 型 : 

1) 如 果 T 要 读 取 R, 的 一 些 字段 ， 它 必须 首先 获得 R, 的 某 个 意向 共享 (intention shared， 或 
简写 为 IS) 锁 。 然 后 它 才 可 以 申请 对 那些 字段 施加 某 个 共享 (shared, S) 锁 。 

2) 如 果 T 要 更 新 R1 的 一 些 字段 ， 它 必须 首先 获得 Ri 的 某 个 意向 排他 (intention exclusive, 
或 简写 为 IX) 锁 。 然 后 它 才 可 以 申请 对 那些 字段 施加 某 个 排他 (exclusive，X) M. 

3) 如 果 T, 要 更 新 RR 的 一 些 字段 ,但 是 要 先 读 取 所 有 的 字段 ， 以 便 决定 对 哪些 字段 进行 更 
新 (比如 ， 它 要 更 新 所 有 值 小 于 100 的 字段 )， 那 么 它 必 须 首 先 获 得 的 共享 意向 排他 (shared 
intention exclusive， 或 简写 为 SIX) 锁 。 然 后 它 才 可 以 读 取 RR 内 所 有 的 字段 ， 并 申请 对 其 需要 
更 新 的 字段 施加 某 个 X 锁 。(SIX 锁 是 对 Ri 施加 的 S 锁 和 IX 锁 的 一 种 组 合 。) 
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申请 的 模式 





图 24-9 意向 锁 的 冲突 表 。 x 表明 加 锁 模 式 之 间 有 冲突 


尽管 现在 事务 必须 要 获得 附加 的 锁 ， 然 而 由 于 意向 锁 可 以 和 许多 其 他 类 型 锁 交 换 ， 我 们 
还 是 可 以 利用 它 提高 性 能 。 图 24-9 给 出 了 粒度 锁 的 冲突 表 。 例 如 ， 它 表明 ， 如 果 该 数据 项 已 
经 加 有 S 锁 ， 那 么 再 申请 对 该 数据 项 加 I[X 锁 就 会 遭 到 拒绝 。 其 理由 是 ，S 锁 允许 读 取 所 有 数据 
项 ， 可 是 IX 锁 却 允 许 事 务 对 某 些 数据 项 施加 写 锁 。 相 反 地 ， 如 果 某 个 数据 项 已 加 的 是 IS 镇 ， 
那么 对 其 加 IX 锁 的 请 求 就 可 能 会 得 到 批准 。 其 理由 是 , IS 锁 允许 其 子 集 包含 已 加 S 销 的 数据 项 ， 
. 而 1X 锁 也 允许 其 子 集 包 含 已 加 X 锁 的 数据 项 。 这 些 子 集 是 不 相交 的 ， 如 果 这 样 的 话 ， 就 不 会 
有 冲突 了 。 然 而 ， 倘 车 它 们 并 非 是 不 相交 的 ， 那 么 由 于 事务 将 不 得 不 对 所 包含 的 数据 项 逐个 
施加 S 锁 和 X 锁 ， 因 此 在 低级 别 中 就 会 发 现 冲突 。 

在 前 面 的 例子 中 ， 当 T, 对 Ri 施加 I[X 锁 之 后 ， 就 不 再 会 批准 任何 事务 对 Ri 施加 排他 锁 了 。 

一 般 情况 下 ， 需 要 加 锁 的 数据 项 是 按 层次 结构 组 织 的 ， 这 可 以 用 一 棵 树 来 表示 。 其 中 ， 
树 的 节点 表示 的 每 个 数据 项 都 是 包含 在 此 树 中 其 父 节 点 表示 的 数据 项 内 的 。 因 此 ， 毫 无 疑问 ， 
对 该 树 中 的 某 个 数据 项 加 锁 意 味 着 对 其 所 有 子 项 加 锁 〈 对 记录 加 锁 无 疑 意味 着 对 其 所 有 字段 
的 加 锁 )。 一 般 规 则 是 ， 在 对 某 个 特定 的 数据 项 (不 一 定 是 树叶 ) 加 锁 之 前 ， 必 须 对 该 层次 结 
构 中 所 有 包含 它 的 数据 项 (祖先 ) 施加 某 个 适当 的 意向 锁 。 因 此 ， 一 个 事务 为 了 对 某 个 处 于 S 
模式 的 数据 项 加 锁 ， 它 首先 必须 从 树 根 开始 ， 依 次 对 直到 该 数据 项 的 路 径 上 所 遇 到 的 所 有 数 
据 项 施加 IS 横 式 的 锁 。 最 后 才 要 求 加 S 锁 ， 以 便 确 保 该 事务 只 有 在 所 有 的 锁 到 位 后 才能 实际 访 
问 目标 对 象 。 锁 的 释放 则 以 相反 的 顺序 进行 。 类 似 地 ， 要 对 某 个 数据 项 施加 X 锁 ， 也 必须 首先 
对 从 树 根 开始 到 该 数据 项 的 路 径 上 的 所 有 的 数据 项 施加 IX 锁 。 

我 们 特意 把 我 们 的 例子 建立 在 一 个 使 用 记录 和 字段 的 系统 的 基础 上 ， 而 不 是 建立 在 使 用 
表 和 元 组 的 系统 的 基础 上 ， 因 此 幻影 不 会 是 一 个 问题 。 然 而 ， 当 我 们 把 粒度 加 锁 的 概念 应 用 
到 关系 数据 库 上 时 ， 这 个 问题 就 会 凸显 出 来 ， 届 时 我 们 必须 要 确保 幻影 不 会 出 现 。 在 下 一 节 ， 
我 们 将 讨论 粒度 加 锁 的 一 种 手段 ， 它 确实 不 会 导致 幻影 ， 并 且 已 用 于 很 多 商业 DBMS 中 。 


24.3.1 索引 锁 : 无 幻影 的 粒度 加 锁 


我 们 讨论 了 在 关系 数据 库 中 保证 可 串 行 化 调度 的 两 种 方法 : 谓词 加 锁 和 表 加 锁 。 我 们 指 
出 过 它们 各 自 的 缺陷 : 谓词 加 锁具 有 计算 复杂 性 ， 而 表 加 锁 的 粒度 粗糙 。 表 加 锁 的 粒度 粗糙 
这 个 缺点 可 以 通过 对 个 别 元 组 加 锁 来 克服 ， 但 是 这 会 导致 幻影 和 不 可 串 行 化 的 现象 。 对 存储 
元 组 的 页 面 (而 不 是 元 组 本 身 ) 加 锁 ， 在 某 些 方面 更 加 有 效 ， 但 是 同样 也 会 导致 幻影 。 

很 多 商用 DBMS 采 用 一 种 涉及 元 组 、 页 面 与 表格 的 扩展 的 粒度 加 锁 方 法 来 消除 幻影 并 确 
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保 可 串 行 化 调度 。 防 止 幻影 的 最 主要 需求 就 是 ， 在 事务 Ti 采用 谓词 P 访 问 某 个 表 R 以 后 ， 没 有 
其 他 任何 并 发 执行 的 事务 T, 将 一 个 同样 满足 P 的 (幻影 ) 元 组 t 插 入 R 中 ， 直 到 Ti 终止 为 止 。 如 
采 DBMS 使 用 页 面 锁 ， 那 么 当 T 访 问 R 时 ， 它 只 锁 住 那 些 在 访问 过 程 中 实际 被 扫描 到 的 页 面 
(除非 R 的 所 有 页 面 都 被 扫描 到 了 ， 只 有 在 这 种 情况 下 ， 它 才 对 R 加 锁 )。 当 访问 涉及 索引 时 ， 
短语 “那些 在 访问 过 程 中 实际 被 扫描 到 的 页 面 ” 并 不 像 看 起 来 那么 简单 。 

我 们 这 里 所 描述 的 方法 取决 于 Ti 是 如 何 访问 R 的 。 在 为 访问 满足 P 的 元 组 的 SQL 语句 构建 
查询 执行 计划 时 ， 系 统 要 确定 是 否 有 现成 的 索引 可 以 利用 。 如 果 T 对 R 执 行 了 一 个 SELECT 语 
句 ， 并 且 任 何 索引 可 用 ， 那 么 系统 就 必须 搜索 R 中 的 每 一 个 页 面 ， 以 定位 满足 P 的 元 组 。 为 了 
进行 搜索 ，T 需 要 对 R 加 S 锁 。 如 果 直 到 T 提 交 为 止 仍然 保持 该 锁 ， 那 么 T: 就 不 可 能 插入 t， 
为 它 首先 必须 对 R 施 加 〈 相 冲突 的 ) IX 锁 。 同 样 地 ， 如 果 T 利 用 谓词 P 对 R 执 行 某 个 DELETE 语 
句 (我 们 后 面 再 考虑 UPDATE 语 名)， 也 没有 任何 索引 可 用 ， 那 么 它 同样 也 必须 要 搜索 R 中 的 
每 个 页 面 ， 以 定位 满足 P 的 元 组 .在 这 种 情况 下 ，Ti 首 先 需要 对 R 施 加 某 个 SIX 锁 (再 次 提醒 
一 下 ，SIX 锁 相当 于 S 锁 加 上 IX 锁 )。 然 后 ， 它 就 对 包含 满足 P 的 元 组 的 页 面 施加 X 锁 9 。 同 样 
地 ， 倘 车 不 先 对 R 施 加 IX 锁 ( 它 与 T! 拥 有 的 S 锁 相 冲 突 )，T; 是 不 能 插入 t 的 。 因 此 ， 在 没有 任 
何 索 引 可 用 时 ， 利 用 粒度 加 锁 就 能 防止 幻影 的 出 现 。 

如 果 T! 通 过 一 个 索引 来 访问 R， 那 么 情况 就 更 加 复杂 了 。 在 这 种 情况 下 ， 不 需要 对 RR 进行 
整体 扫描 。 如 果 T 使 用 谓词 P 对 R 执 行 某 个 SELECT 操作 ， 它 只 需要 对 R 施 加 一 个 IS 锁 ， 并 对 R 
中 含有 满足 P 的 元 组 的 页 面 获得 S 锁 ， 这 些 页 面 可 以 通过 索引 访问 到 。 同 样 ， 如 果 T 使 用 谓词 P 
对 R 执 行 某 个 DELETE 操 作 ， 也 只 需 对 R 施 加 一 个 IX 锁 ， 并 对 R 中 含有 满足 P 的 元 组 的 页 面 施加 
X 锁 ， 这 些 页 面 可 通过 索引 访问 到 。 

遗憾 的 是 ， 这 个 加 锁 协 议 并 不 能 防止 幻影 的 出 现 。 如 果 T, 试 图 在 R 中 插入 一 个 幻影 ， 它 可 
以 对 R 施 加 IX 锁 ， 因 为 这 个 锁 与 T, 所 获得 的 IS 或 I[X 锁 都 不 会 产生 冲突 。 因 此 ， 在 表层 次 上 没有 
任何 冲突 。 此 外 ， 倘 若 Tz 要 播 入 的 幻影 存储 在 另外 一 个 不 同 的 页 面 上 ， 而 并 非 是 Ti 加 锁 的 页 
面 ， 那 么 在 页 层次 也 不 会 有 冲突 。 无 论 如 何 ， 对 于 T: 来 说 ， 插 入 幻影 是 有 可 能 的 。 因 此 需要 
有 某 种 机 制 来 防止 上 述 情 况 。 

例如 ， 在 学 生 注册 系统 的 模式 里 ， 表 STupENT 有 一 个 属性 Address ( 为 简单 起 见 ， 我 们 假 
设 地 址 仅仅 指 城镇 )、Ti 可 以 执行 下 列 SELECT 语 句 : ` 


SELECT * 
FROM STUDENT S 
WHERE S.Address = 'Stony Brook' 


如 果 对 于 关系 STUDENT 中 的 Address 存 在 索引 ADDRIDX， 就 可 以 用 它 来 查找 住 在 Stony Brook 
的 学 生 。 需 要 对 STUDENT 加 IS 锁 ， 而 对 那些 包含 描述 居住 在 Stony Brook 的 学 生 的 元 组 的 页 面 
则 需要 加 S 锁 。 然 而 ， 这 些 锁 并 不 能 防止 T: 插 入 一 个 元 组 tf， 该 元 组 描述 某 个 住 在 Stony Brook 
的 新 来 的 学 生 ， 因 为 T, 只 需要 对 STUDENT 加 IX 锁 ， 并 对 t 所 插入 的 页 面 加 X 锁 。 (该 页 面 也 许 和 
用 于 存储 居住 在 Stony Brook 的 学 生 的 元 组 的 所 有 页 面 都 不 相同 )。 

为 了 防止 幻影 ， 除了 对 表 应 用 适当 的 意向 锁 并 对 被 访问 的 数据 页 面 施 加 页 面 锁 以 外 ， 事 
务 还 需要 对 于 索引 结构 本 身 所 在 的 页 面 加 锁 。 商 用 DBMS 通 常 使 用 两 类 索引 。 一 类 索引 包含 


O ”如果 DBMS 支 持 元 组 加 锁 ， 那 么 它 先 对 R 和 包含 满足 P 的 元 组 的 页 面 施加 SIX 锁 ， 然 后 再 对 该 元 组 施加 X 锁 。 
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一 个 指针 ， 该 指针 仅仅 指向 可 能 存储 描述 了 居住 在 Stony Brook 的 学 生 的 元 组 的 那些 页 面 8 。 
带 碰撞 的 索引 ， 数 据 文件 里 每 一 行 的 位 置 都 由 其 搜索 键 的 值 控制 的 聚 徐 索引 就 属于 这 一 范畴 。 
集中 的 静态 散 列 索引 (其 中 在 同一 个 散 列 桶 内 的 所 有 行 都 存储 在 同一 个 页 面 里 ) 也 属于 这 种 
索引 。 在 第 二 类 索引 方式 里 ， 那 种 用 来 存放 所 有 的 描述 居住 在 Stony Brook 的 学 生 的 元 组 的 唯 
一 的 STUDENT 页 面 是 不 存在 的 。 当 T 要 求 插入 t 时 ， 存 储 t 的 页 面 是 确定 的 ， 而 且 一 个 指向 该 页 
面 的 指针 就 存储 在 ADDRIDX 上 。 任何 二 级 索引 都 属于 这 一 范畴 。 

我 们 用 于 防止 幻影 的 策略 取决 于 索引 的 类 型 。 如 果 索 引 属 于 第 一 类 ， 那 么 通过 对 包含 有 
描述 居住 在 Stony Brook 的 学 生 的 元 组 的 SrupENT 页 面 施 加 长 期 锁 (至 于 是 S 还 是 X， 则 取决 于 
Ti 是 执行 SELECT 还 是 DELETE)，Ti 能 够 使 ?推迟 。 由 于 t 必 须 插 入 到 该 页 面 ， 所 以 T 就 延迟 
到 了 完成 再 执行 。 例 如 ， 在 静态 散 列 里 ，Ti 需 要 对 Stony Brook 散 列 到 的 散 列 桶 加 一 个 S 锁 ， 

如 果 索 引 是 第 二 类 的 ， 那 么 Ti 要 在 使 用 索引 期 间 ， 对 访问 的 整个 AppRIpx 叶 贡 面 加 长 期 
读 锁 ， 而 Ts 要 求 对 所 有 需要 更 新 的 (如 它 向 其 中 插入 指针 ) 叶 索 引 页 面 加 长 期 X 锁 。 图 24- 
10 说 明了 这 种 情况 ， 其 中 B* 树 作为 SrupENT 表 中 Address 属 性 的 二 级 索引 。 我 们 假设 地 址 值 
为 ai, i >0, 以 及 ai < diio 在 执行 SELECT 语 句 时 ， T1 对 该 索引 的 叶 页 面 A 加 长 期 S 锁 9 ， 此 索引 
包含 指向 STUDENT 数据 文件 中 (其 中 包含 描述 居住 在 Stony Brook 的 学 生 的 元 组 ) 的 页 面 B、C、 
D 的 指针 。 以 后 ， 当 T: 想 要 插入 一 个 新 的 描述 居住 于 Stony Brook 的 学 生 的 元 组 时 ， 就 需要 插 
入 一 个 指针 ， 该 指针 指向 包含 SruDENT 的 每 个 索引 中 元 组 的 数据 页 面 。 


B!* 树 ADDRIDX 





图 24-10 STUDENT 表 上 的 无 碰撞 B! 树 二 级 索引 


在 AppRIDx 的 情况 中 ， 该 指针 必须 要 插入 索引 页 面 A 中 ， 因为 叶 页 面 是 按 Address 分 类 的 。 
这 就 需要 对 A 加 X 锁 ， 这 和 Ti 产生 了 冲突 ， 所 以 Ti 不 得 不 等 待 。 从 而 新 的 元 组 得 以 防止 成 为 幻 
影 ， 尽 管 实际 上 ， 它 最 终 也 许 还 是 储存 于 某 个 不 同 于 B、 C 或 D 的 数据 页 面 上 ; 而 T, 和 Ts 对 


日 ”注意 ， 当 一 个 页 面 加 锁 后 ， 任何 和 该 页 面相 关 的 溢出 链 也 会 被 锁 住 。 
日 一般 情况 下 ， 也 许 会 有 多 个 这 样 的 叶 页 面 ， 但 是 算法 是 不 变 的 。 
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STUDENT 所 加 的 也 只 需要 是 兼容 锁 (IS 和 IX)。Ti 必 须 一 直 保 留 对 A 所 加 的 锁 ， 直 到 它 提 交 为 止 。 
从 直观 上 说 ， 通 过 这 种 方式 对 索引 加 锁 ， 事 务 能 有 效 地 获得 对 于 谓词 Address = 'Stony Brook' 
的 谓词 锁 。 

虽然 这 种 方法 可 以 消除 由 INSERT 语 句 引 起 的 幻影 ， 然 而 在 使 用 UPDATE 语 句 时 ， 还 是 会 
碰 到 其 他 的 一 些 问 题 。 一 个 UPDATE 语 句 和 人 先 处 理 一 个 删除 需要 更 新 的 元 组 的 DELETE 语 句 ， 
后 跟 处 理 一 个 插入 更 新 后 元 组 的 INSERT 语 名 等 价 。 因 此 ，UPDATE 有 双重 特性 ， 由 于 它 具 有 
DELETE 部 分 ， 所 以 它 要 防止 幻影 ; 而 由 于 它 又 具有 INSERT 部 分 ， 所 以 它 又 可 能 引起 幻影 。 
如 果 使 用 的 是 第 一 类 索引 ， 那 么 Ti 所 更 新 的 元 组 也 许 就 不 得 不 移 到 数据 文件 的 新 页 面 中 。 例 
如 ， 在 采用 散 列 方法 的 情况 下 ， 如 果 包 含 在 散 列 键 里 的 更 新 后 的 元 组 t' 的 某 个 属性 被 修改 ， 那 
么 t' 必 须 被 移 到 某 个 新 的 散 列 桶 中 。 在 这 种 情况 下 ， 为 了 防止 T 插 入 满足 UPDATE 语 句 的 
WHERE 子 句 的 幻影 元 组 ，T 必 须 保持 原始 的 包含 t' 的 散 列 桶 上 的 锁 。( 此 外 ，T 还 需要 对 t' 所 
移 往 的 散 列 桶 加 X 锁 。) 类 似 地 ， 如 果 使 用 的 是 第 二 类 索引 ， 而 包含 在 搜索 键 里 的 (的 某 个 属 
性 被 修改 ， 那 么 指向 t 的 指针 必须 移 到 一 个 新 的 位 置 。Ti 必 须 始终 锁 住 原始 的 包含 指针 的 页 面 ， 
以 防止 随后 插入 指向 幻影 元 组 的 指针 。( 此 外 ，T 还 必须 用 X 锁 锁 住 指向 t 的 指针 所 移 往 的 索引 
页 面 。) | 

我 们 现在 总 结 一 下 ， 无 索引 可 用 以 及 可 以 使 用 B* 树 索引 时 的 协议 。 


关系 数据 库 的 粒度 加 锁 协 议 


。 如 果 在 执行 某 个 SELECT、UPDATE 或 DELETE 语 名 时 ， 没 有 索引 可 用 ， 那 么 系统 必须 
搜索 在 FROM 子 句 中 命名 的 表 的 每 个 页 面 ， 以 定位 满足 该 语句 的 WHERE 子 名 的 元 组 。 
。SELECT 语 句 需 获得 对 表 的 S 锁 。 

“。UPDATE 或 者 DELETE 语 句 则 需 对 表 加 SIX 锁 ， 对 包含 需要 更 新 或 删除 的 元 组 的 页 面 
加 X 锁 。 

。 如 果 在 访问 中 使 用 的 是 B* 树 索引 ， 那 么 
“SELECT 语句 需 对 表 加 IS 锁 ， 对 包含 满足 该 语句 WHERE 子 句 的 元 组 的 页 面 加 S 锁 。 

* UPDATE 或 者 DELETE 语 句 则 需 对 表 加 IX 锁 ， 对 包含 需要 更 新 或 删除 的 元 组 的 页 面 加 
X 锁 。 

“SELECT、UPDATIE 和 DELETE 语 名 还 需要 对 搜索 期 间 读 取 到 的 B" 树 的 时 页 面 加 长 期 S 
锁 ， 并 对 任何 已 更 新 的 B* 树 页 面 加 长 期 X 锁 。 

这 一 协议 具有 以 下 特性 ， 当 企图 播 和 人 幻影 时 ， 就 会 在 下 列 场合 发 生 加 锁 冲 突 : 

。 当 不 使 用 索引 时 ， 在 表层 次 可 能 会 发 生 加 锁 神 突 。 

* 当 使 用 索引 时 ， 则 沿 着 索引 的 路 径 可 能 会 发 生 加 锁 冲 突 。 

因此 ， 它 确实 不 允许 幻影 ， 并 且 可 以 产生 可 串 行 化 调度 。 

即便 没有 索引 可 用 ， 粒 度 加 锁 也 比 我 们 以 前 所 描述 的 方法 的 并 发 性 更 高 。 在 对 所 有 隔离 

级 别 (包括 SERIALIZABLE 级 ) 加 锁 的 过 程 中 ， 写 入 语句 要 求 对 某 个 谓词 施加 长 期 写 入 锁 。 
在 没有 索引 和 粒度 锁 时 ， 其 实现 方法 是 对 相应 表 施加 长 期 写 信 锁 。 通 过 粒度 加 锁 ， 一 个 不 使 
用 索引 的 写 人 语句 只 需要 对 表 加 SIX 锁 ， 并 对 包含 需要 更 新 、 插 和 人 或 删除 的 行 的 页 面 加 X 锁 就 
可 以 了 。 这 些 锁 可 以 防止 并 发 事务 读 取 那 些 行 及 修改 表 中 的 任何 行 ， 但 是 允许 并 发 事务 读 取 
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该 表 的 任何 行 ， 而 不 是 已 更 新 页 面 里 的 行 。 因 此 ， 粒 度 加 锁 可 以 防止 幻影 在 SERIALIZABLE 
级 别 出 现 〈 因 而 确保 了 可 串 行 性 )， 但 这 种 方法 锁定 的 数据 项 比 对 整个 表 加 写 锁 要 少 〈 因 此 提 
高 了 并 发 性 )。 如 果 写 人 语句 使 用 索引 的 话 ， 则 就 可 以 实现 的 并 发 程度 会 更 高 。 

值得 注意 的 是 ， 粒 度 加 锁 可 以 用 于 (幻影 不 成 问题 的 ) 较 低 的 隔离 级 别 。 比 如 ， 在 
REPEATABLE READ 级 执行 某 个 SELECT 语句 ， 需 要 对 表 施 加 IS 锁 ， 并 对 包含 满足 此 语句 的 
WHERE 子 句 的 元 组 的 页 面 加 S 锁 。 但 是 ， 与 SERIALIZABLE 级 相 比 ， 它 不 需要 对 该 语句 所 用 
的 索引 的 叶 页 面 施加 长 期 写 锁 。 

1. 锁 的 逐步 升级 

当 一 个 事务 积 罕 了 太 多 的 细 粒 度 锁 时 ， 粒 度 加 锁 的 开销 就 会 非常 大 。 这 种 开销 有 两 种 形 
式 : DBMS 中 用 来 记录 每 次 请 求 的 锁 的 信息 的 空间 开销 ; 用 于 处 理 每 个 加 锁 请 求 的 时 间 开 销 。 
当 某 个 事务 需要 对 表 中 大 量 的 页 面 (或 者 元 组 ) 加 锁 时 ， 它 很 可 能 会 这 样 不 断 继续 下 去 。 因 
此 ， 把 这 些 锁 换 成 对 整个 表 的 单一 锁 是 有 好 处 的 。 

这 种 技术 就 是 我 们 所 说 的 锁 的 逐步 升级 (lock escalation )。 应 该 在 并 发 控制 中 设 定 某 个 图 
值 ， 以 限制 在 某 个 表 中 一 个 事务 可 能 得 到 的 页 面 锁 的 数量 。 当 事务 达到 这 一 限制 ， 并 发 控制 
就 会 试图 对 整个 表 加 锁 (页 面 锁 的 情况 也 与 此 类 似 )。 一 旦 该 表 锁 得 到 批准 ， 那 么 对 此 表 施 加 
的 页 锁 和 意向 锁 就 可 以 释放 。 必 须 注意 的 是 ， 在 这 一 模式 中 存在 死 锁 的 危险 。 如 果 两 个 事务 
都 在 请 求 页 锁 ， 其 中 至 少 有 一 个 是 写 人 者 ， 而 两 者 都 达到 了 它们 的 国 值 ， 这 时 就 会 产生 死 锁 ， 
因为 它们 都 不 能 升级 到 表 锁 。 

2. 多 级 控制 * 

数据 的 抽取 一 层 接 一 层 可 以 达到 任意 深度 ， 这 样 建立 起 来 的 多 级 并 发 控制 还 没有 被 广泛 
采用 ,但 是 可 以 在 DBMS 中 使 用 一 种 缩 略 的 形式 。 关 键 的 问题 是 ， 当 不 得 不 更 新 、 插 入 或 者 
删除 元 组 时 ， 对 于 包含 它 的 整个 页 面 一 般 是 施加 排他 锁 ， 以 便 页 面 中 关于 存储 分 配 的 信息 可 
以 被 调整 。 因 此 ， 为 了 确保 该 语句 的 隔离 性 ， 就 需要 对 某 个 SQL 语句 访问 到 的 页 面 加 锁 。 但 
是 ， 一 且 该 语句 继续 维持 那些 页 锁 ， 就 会 不 必要 地 降低 并 发 性 ， 因 为 它们 阻止 了 其 他 事务 以 
总 体 上 无 冲突 的 方式 访问 该 页 面 。. 

为 了 增加 并 发 性 ， 可 以 把 SQL 语句 看 成 是 某 个 事务 的 子 事务 。 一 旦 该 事务 看 到 了 SQL 语 
名 的 抽取 ， 那 么 此 子 事务 就 也 会 看 到 读 取 和 写 人 的 页 面 的 抽取 。 于 大 ， 此 子 事务 可 以 对 其 需 
要 访问 的 数据 页 面 加 锁 ， 然 后 在 结束 的 时 候 释 放 它 们 。 这 样 ， 该 事务 就 能 够 维持 对 元 组 和 访 
问 路 径 的 较 高 级 别 的 锁 ， 以 确保 合适 的 隔离 性 。 

3. 表 分 段 

表 分 段 (table fragmentation) 是 一 种 和 粒度 加 锁 相 关 的 有 用 技术 。 再 次 以 表 STUDENT 为 例 。 
一 个 希望 抽取 居住 在 Stony Brook 的 学 生 的 信息 的 应 用 程序 可 能 执行 下 述 语句 : 

SELECT * | 

FROM STUDENT S 

WHERE S.Address = ‘Stony Brook' 

另 一 种 数据 组 织 结构 是 将 STUDENT 划分 成 一 些 称 为 片段 (fragment) 的 单独 的 表 ， 每 个 城镇 对 
应 一 个 表 。 比 如 ， 我 们 可 以 把 所 有 的 满足 谓词 Address='Stony Brook' 的 元 组 放 到 一 个 表 
STUpD_SB 里 ， 而 所 有 满足 谓词 Address='Smithtown' 的 元 组 则 放 到 另 一 个 表 STUD_SM 里 ， 依 此 
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类 推 。 某 个 想 要 检索 居住 在 Stony Brook 的 学 生 的 信息 的 事务 ， 现 在 可 以 用 如 下 语句 执行 : 


SELECT * 
FROM STUD SB 


我 们 可 以 看 到 ， 该 片段 上 的 表 锁 等 价 于 用 来 执行 分 段 的 谓词 的 某 个 谓词 锁 。 这 就 消除 了 - 
用 索引 加 锁 替代 谓词 加 锁 的 要 求 。 由 于 原始 表格 已 经 不 再 存在 ,我 们 就 不 用 实现 两 种 不 同 粒 
度 的 加 锁 。 所 以 ， 一 个 申请 对 某 个 片段 加 表 锁 的 事务 ， 就 不 再 需要 更 高 级 的 意向 锁 了 。 在 第 
18 章 我 们 已 经 详细 讨论 过 分 段 。 它 的 优势 在 于 ， 表 分 段 比 原始 表 的 粒度 更 细 ， 所 以 我 们 可 以 
获得 一 个 更 高 级 别 的 并 发 性 。 它 的 劣势 在 于 ， 贯 穿 多 个 片段 的 查询 会 变 得 难以 处 理 。 例 如 ， 
某 个 要 检索 所 有 居住 在 Stony Brook 或 是 Smithtown 的 学 生 的 元 组 的 查询 ， 或 者 是 使 用 并 不 涉及 
属性 Address 的 某 个 谓词 的 查询 都 必须 要 访问 多 个 表 。 


24.3.2 对 象 数据 库 里 的 粒度 加 锁 * 


关系 数据 库 的 粒度 加 锁 的 许多 思想 同样 也 适用 于 对 象 数据 库 。 我 们 考虑 某 个 银行 账户 的 
应 用 程序 。 假 设 一 个 关系 数据 库 中 拥有 某 个 其 元 组 代表 个 人 账户 的 表 AccouNTs。 同 样 地 ， 假 
设 一 个 对 象 数据 库 拥 有 某 个 其 对 象 代 表 个 人 账户 的 类 AccouNTSCLASS。 正 如 元 组 包含 在 表 里 
一 样 ， 我 们 可 以 认为 对 象 包含 在 类 里 。 而 且 ， 我 们 还 可 以 使 用 相同 的 加 锁 模式 (共享 、 排 他 
以 及 相应 的 意向 模式 )， 并 用 关系 数据 库 中 的 解释 方式 来 在 对 象 数 据 库 中 解释 它们 : 

“在 关系 数据 库 中 ， 对 表 加 锁 意 味 着 对 其 中 的 所 有 元 组 加 锁 。 

。 在 对 象 数据 库 中 ， 对 类 加 锁 意 味 着 对 其 中 所 有 的 对 象 加 锁 。 
因此 ， 在 银行 的 对 象 数据 库 中 ， 某 个 粒度 加 锁 协 议 就 要 求 我 们 在 对 某 个 账户 对 象 加 锁 之 前 ， 
首先 必须 对 类 AccouNTCLASs 施 加 合适 的 意向 锁 。 

对 象 数据 库 也 支持 继承 性 。 因此， 在 银行 应 用 程序 中 ， 类 的 层次 结构 可 能 包括 这 样 的 事 
实 : SAVINGSACCOUNTSCLASS 和 CHECKINGACCOUNTSCLASS 都 是 AccouNTSCLASS 的 子 类 ， 
ECONOMYCHECKINGACCOUNTSCLASS 是 CHECKINGAECOUNTSCLASS 的 子 类 。 由 于 类 
EcoNOMYCHECKINGACCOUNTSCLASS 中 的 对 象 也 是 其 父 类 CHECKINGAccoUNTSCLASS 和 AccoUNTS 
CLASS 的 对 象 ， 所 以 对 AccouNTSCLASS 的 加 锁 就 隐 含 着 对 CHECKINGAccoUNTSCLASS 和 
EcoNOMYCHECKINGACCOUNTSCLASs 中 的 所 有 对 象 加 锁 。 辣 样 地 ， 在 我 们 对 EcoNoMYCHECKING- 
AccoUNTSCLASS 类 加 锁 前 ， 我 们 必须 对 CHECKINGACCOUNTSCLASS 类 和 AccouNTSCLASS 类 都 施 
加 合适 的 意向 锁 。 因 此 ， 对 一 个 类 加 锁 ， 就 意味 着 对 下 列 内 容 加 锁 : 

e 该 类 的 所 有 对 象 。 | 

“该 类 的 所 有 子孙 类 (因而 也 包括 那些 类 中 的 所 有 对 象 ) 。 | 

我 们 现在 从 上 述 讨论 中 归结 出 对 象 数 据 库 的 粒度 加 锁 的 一 个 (简化 的 ) 协议 。。 


O 一 些 DBMS 也 许多 许 不 同 的 粒度 一 一 例如 ， 属 性 级 〈 一 个 对 象 的 个 别 属 性 ) ， 或 者 数据 库 级 。 在 某 些 DBMS 
中 ， 一 个 类 的 写 锁 允 许 程序 修改 该 类 的 声明 ， 包 括 它 的 方法 。 其 他 的 一 些 DBMS 会 区 分 对 类 实例 加 锁 (类 
似 于 某 个 表 锁 ) 与 对 类 本 身 加 锁 (类 似 于 某 个 模式 锁 ) ， 前 者 类 实例 指 当前 在 该 类 中 的 所 有 对 象 ， 而 后 者 
类 本 身 则 指 允 许 修改 该 类 的 定义 。 
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对 象 数据 库 的 粒度 加 锁 协 议 


“在 给 对 象 加 锁 之 前 ， 系 统 必 须 先 对 该 对 象 所 属 的 类 及 其 所 有 父 类 施加 合适 的 意向 锁 。 

* 在 给 类 加 锁 之 前 ， 系 统 必 须 先 对 该 类 的 所 有 父 类 施加 合适 的 意向 锁 。 

有 了 这 些 观念 后 ， 我 们 就 会 发 现 ， 对 关系 数据 库 的 隔离 性 和 粒度 加 锁 的 许多 讨论 同样 也 
可 应 用 于 对 象 数据 库 。 


24.4 系统 性 能 的 改进 


性 能 是 系统 设计 的 关键 问题 。 在 本 节 中 ， 我 们 会 给 出 一 些 技术 的 例子 ， 这些 技术 可 以 用 
来 提高 在 加 锁 并 发 性 控制 下 运行 的 应 用 程序 的 性 能 。 
。 事 务 应 该 在 与 应 用 程序 需求 一 致 的 最 低 的 隔离 级 别 执行 
“对 在 模式 中 包含 完整 性 约束 加 以 权衡 ， 所 以 必须 仔细 考察 DBMS 强 制 的 规定 与 事务 中 执 
行 强制 的 代码 。 例 如 ， 修 改 某 个 在 约束 中 命名 的 数据 项 的 一 些 事务 ， 可 以 用 不 会 违反 约 
束 的 方式 去 修改 它 ， 然 而 ， 如 果 约 束 是 模式 的 一 部 分 ， 那 么 它 将 在 该 事务 提交 时 (不 必 
要 地 ) 进行 检测 。 如 果 这 样 的 事务 需要 频繁 执行 ， 最 好 限制 一 下 对 事务 代码 的 约束 检测 ， 
因为 事务 代码 也 许 会 违反 菜 种 约束 。 另 一 方面 ， 这 样 一 个 决策 要 和 潜在 的 维护 消耗 相互 
比较 考虑 : 如 果 我 们 稍 后 必须 要 修改 此 约束 ， 那 么 所 有 检测 该 约束 的 事务 的 代码 也 必须 
改变 并 重新 编译 。 但 如 果 约 束 是 模式 的 一 部 分 ， 那 么 这 些 就 没有 不 必要 了 。 
。 某 些 完 整 性 约束 应 该 在 数据 库 模式 内 加 以 声明 ， 以 便 它们 会 自动 地 由 DBMS 检 验 ， 然 后 
允许 某 个 事务 在 比 应 用 程序 需求 相 一 致 的 更 低 的 隔离 级 别 上 正确 执行 。( 如 果 那 些 完整 
性 约束 不 是 由 DBMS 检 验 的 ， 该 事务 按照 那个 隔离 级 别 执行 可 能 是 不 正确 的 ) 这 基本 
上 是 一 种 乐观 型 方法 ， 它 假设 了 某 种 程度 上 的 交叉 ， 这 种 交叉 不 大 可 能 造成 数据 库 的 不 
一 致 性 。 万 一 出 现 这 样 的 交叉 情况 (极其 难得 )， DBMS 将 在 俩 测 到 违反 约束 时 异常 中 
止 该 事务 。 然 而 ， 不 是 由 违反 完整 性 约束 所 导致 的 错误 是 侦 测 不 到 的 。 
“事务 应 该 尽 可 能 地 短 ， 以 限制 保持 锁 的 时 间 。 特 别 重要 的 是 ， 在 初始 化 事务 前 ， 需 要 从 
用 户 处 收集 所 需 的 信息 。 由 于 与 用 户 交互 要 花费 很 长 的 时 间 ， 因 此 在 其 进行 过 程 中 ， 不 
应 该 加 锁 。 把 一 个 较 长 的 事务 分 解 成 一 系列 较 短 的 事务 (假设 可 以 在 维持 一 致 性 的 情况 
下 完成 的 话 ) 也 是 不 错 的 。 在 极端 的 情况 下 ， 每 个 SQL 语句 就 是 一 个 事务 。 
。 设 计数 据 库 ， 以 便 使 最 频繁 调用 的 事务 能 够 有 效 地 执行 。 这 可 以 包括 反 规 范 化 
(denormalization) (参见 8.13 节 )， 以 避免 大 量 的 联结 
* 在 频繁 执行 搜索 时 应 该 考虑 索引 。 在 某 些 情况 下 ， 这 意味 着 为 某 个 表 建 立 若干 个 二 级 索 
引 。 尽 管 在 表 经 常 更 新 的 情况 下 , 索引 的 维护 开销 也 要 被 考虑 进来 。 为 了 避免 多 重 索 引 ， 
索引 应 该 能 够 支持 尽量 多 的 搜索 。 在 B* 树 索引 中 ， 这 意味 着 要 仔细 地 选择 和 排列 搜索 键 
的 属性 。 对 于 幻影 敏感 的 应 用 程序 来 说 ， 采 用 索引 锁 而 不 是 表 锁 ， 可 能 会 增加 并 发 性 。 
“ 若 逐 步 升级 的 阔 值 很 容易 达到 ， 经 常 需要 表 锁 ， 那 么 这 种 锁 的 逐步 升级 是 低 效 的 。 有 些 
数据 库 允 许 事务 在 访问 表 之 前 明确 地 申请 表 锁 (手动 加 锁 )。 作 为 一 种 选择 ， 如 果 需 要 
的 页 面 (或 者 元 组 ) 锁 的 数量 可 以 估计 出 来 ,而且 也 不 是 很 大 ， 那 么 阔 值 就 可 以 设置 成 
高 于 该 值 。 
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* 加 锁 粒 度 可 能 会 下 降 ， 因 此 通过 对 一 个 或 者 多 个 表 分 段 ， 往 往 可 以 增加 并 发 性 。 

* 在 使 用 页 面 加 锁 的 系统 里 ， 如 果 两 个 事务 分 别 访问 存储 在 同一 个 页 面 上 的 两 个 不 同 的 元 
组 ， 就 会 发 生 加 锁 冲 突 。 把 这 些 元 组 存储 于 不 同 的 页 面 会 降低 这 种 冲突 发 生 的 概率 。 同 
样 ， 如 果 某 个 事务 访问 一 系列 的 元 组 ， 即 便 所 有 那些 元 组 都 聚合 于 少量 页 面 内 ， 但 和 其 
他 事务 的 加 锁 冲 突 也 可 能 降低 。 

“如 果 一 个 事务 以 某 种 顺序 访问 两 个 表 ， 而 另 一 个 事务 以 相反 的 顺序 访问 它们 ， 那 么 就 可 
能 会 产生 死 锁 。 只 要 可 能 ,访问 公共 资源 的 事务 都 应 该 以 相同 的 顺序 对 那些 资源 加 锁 。 


24.5 多 版 本 并 发 控制 


数据 库 的 版 本 (version) 就 是 指 在 某 个 事务 提交 时 所 得 到 的 一 个 数据 库 的 快照 ， 其 中 包 
含 该 事务 的 结果 和 所 有 先前 提交 的 事务 的 结果 。 因 此 ， 版 本 只 包含 已 提交 的 数据 。 一 个 数据 
库 的 许多 版 本 都 是 在 事务 的 某 个 调度 的 执行 过 程 中 产生 的 。 在 多 版 本 DBMS 中 ， 不 同 的 版 本 
都 被 保留 下 来 ， 而 并 发 控制 也 未 必 使 用 当前 的 版 本 来 满足 读 取 某 个 数据 项 的 请 求 。 

在 本 节 中 ， 我 们 将 讨论 三 个 多 版 本 并 发 控制 。 这 些 算法 都 已 在 商用 系统 中 得 到 实现 ， 它 
们 的 优势 在 于 ，( 在 绝 大 多 数 情况 下 ) 读 取 者 无 须 设立 读 锁 。 因 此 ， 读 取 某 个 数据 项 的 请 求 不 
需要 等 待 ; 而 写 人 某 个 数据 项 的 请 求 也 不 需要 等 待 读 取 者 。 这 是 一 个 很 重要 的 优势 ， 特 别 是 
在 许多 应 用 程序 中 ， 读 取 发 生 的 频率 要 比 写 人 高 得 多 。 这 些 优 势 的 代价 是 高 昂 的 ， 为 了 维持 
数 持 数 据 库 的 多 版 本 ， 就 需要 额外 地 提高 系统 的 复杂 性 。 

在 我 们 讨论 的 三 个 算法 中 ， 后 面 两 种 算法 可 能 会 产生 不 可 申 行 化 的 调度 ， 从 而 导致 不 正 
确 的 数据 库 状态 。 第 一 种 算法 总 是 产生 可 串 行 化 调度 ， 但 是 行为 可 能 不 太 直 观 。 

事务 级 读 一 致 性 a 

在 指定 一 个 多 版 本 并 发 控制 时 ， 必 须 确 定 的 第 一 个 问题 就 是 ,“ 对 一 个 请 求 读 取 数 据 库 中 
的 某 个 数据 项 的 事务 而 言 ， 它 返回 的 是 怎样 的 值 ? ” 当 采 用 READ COMMITTED 隔 离 级 别 时 ， 
多 版 本 算法 确保 返回 的 只 能 是 已 提交 的 数据 (因为 根据 定义 ， 一 个 版 本 所 包含 的 只 能 是 已 提 
交 的 数据 )。 但 回忆 一 下 , 在 READ COMMITTED 级 连续 的 读 取 可 能 会 从 不 同 的 版 本 返回 数据 ， 
而 且 【〈 根 据 我 们 在 24.2.1 节 的 讨论 来 看 ) ， 一 旦 使 用 了 某 个 游标 ， 那 么 从 某 个 SELECT 语句 产 
生 的 结果 集 所 返回 的 元 组 很 有 可 能 来 自 不 同 的 版 本 ; 哪怕 该 结果 集 是 在 此 游标 打开 时 ， 就 以 
某 种 隔离 级 别 计算 出 来 的 也 是 如 此 。 因 此 ， 该 事务 会 看 到 数据 的 某 种 不 一 致 的 视图 ， 即 一 种 
并 非 来 自 某 个 数据 库 版 本 的 视图 。 

有 些 多 版 本 算法 确保 通过 这 类 查询 所 返回 的 数据 具备 某 个 较 强 的 条 件 。 事 务 级 读 一 致 性 
(transaction-level read consistency) 确保 由 某 个 事务 执行 的 所 有 SQL 语句 返回 的 数据 都 来 自 数 
据 库 的 同一 版 本 。 然 而 ， 事 务 级 读 一 致 性 未 必 能 确保 可 串 行 性 。 

另 一 个 必须 确定 的 问题 是 ,“ 一 个 SQL 语句 所 访问 的 是 数据 库 的 哪个 版 本 ? ”一 个 多 版 本 
并 发 控制 可 能 需要 访问 的 版 本 不 是 最 近 提 交 的 事务 所 产生 的 版 本 。 例 如 ， 假 设 事务 Ti 和 T., 在 
某 个 常规 (单一 版 本 ) 的 立即 更 新 翡 观 系统 中 是 活动 的 。 如 果 Ti 写 人 了 某 个 数据 项 ， 恰 好 T， 
打算 读 取 该 数据 项 ， 那 么 就 存在 冲突 ， 于 是 T, 就 需要 等 待 。 在 一 个 多 版 本 系统 中 ， 利 用 在 T， 
写 和 信之 前 就 已 创建 的 某 个 版 本 (值得 注意 的 是 ， 这 不 需要 是 最 近 提 交 的 版 本 )，T, 的 请 求 可 能 
会 得 到 满足 。 因 此 ， 按 照 任何 等 价 的 串 行 顺序 ，T, 都 先行 于 T,。 
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24.5.1 只 读 型 的 多 版 本 并 发 控制 


在 一 般 情 况 下 ， 设 计 一 种 能 够 确保 可 串 行 化 调度 的 多 版 本 并 发 性 控制 是 相当 复杂 的 。 然 
而 ， 有 一 种 特殊 的 多 版 本 控制 的 情况 ， 称 为 只 读 型 的 多 版 本 并 发 控制 (read-only multiversion 
concurrency control) ， 它 可 以 比较 容易 地 实现 ， 并 产生 出 可 串 行 化 的 调度 。.， 

一 个 只 读 型 的 多 版 本 并 发 控制 事先 需要 区 别 两 种 类 型 事务 : REE (read-only) ( 即 不 包 
含 写 操作 ) 和 读 / 写 型 (read/write)， 即 至 少 包含 一 个 写 操作 (也 可 以 包含 读 操 作 )。 

。 读 / 写 型 事务 采用 立即 更 新 的 翡 观 并 发 控制 。 读 锁 和 写 锁 可 以 有 多 种 管理 方法 ， 这 取决 

于 所 选择 的 隔离 级 别 。 事 务 总 是 访问 需要 读 / 写 的 数据 项 的 最 新 版 本 。 

。 只 读 型 事务 Tro 中 的 所 有 读 取 ， 则 是 采用 Tro 首 次 发 出 读 取 请 求 时 就 存在 的 数据 库 的 (已 

提交 的 ) 版 本 来 满足 其 需求 的 。 因 此 ，Tao 直 接 就 是 可 串 行 化 的 ， 而 那个 版 本 所 创建 的 

事务 ， 未 必 都 是 遵循 着 提交 的 顺序 的 。 其 效果 就 像 是 在 To 第 一 次 读 取 时 所 获得 的 数据 

库 的 (已 提交 的 ) 一 个 快照 (snapshot) ; 而 所 有 随后 的 读 取 都 可 以 利用 此 快照 来 满足 。 

因此 ， 只 读 型 事务 是 可 以 提供 事务 级 读 一 致 性 的 。 

如 果 读 / 写 型 事务 可 以 串 行 执 行 ， 那 么 所 有 的 事务 都 可 以 提供 事务 级 读 一 致 性 。 在 这 种 情 
况 下 ， 只 读 型 和 读 / 写 型 事务 的 组 合 调度 是 可 串 行 化 的 。 等 价 的 串 行 顺序 是 按照 读 / 写 型 事务 的 
提交 顺序 排列 ， 而 每 个 只 读 型 事务 都 插入 到 创建 其 快照 的 读 / 写 型 事务 的 后 面 。 

为 了 实现 这 一 控制 ，DBMS 维 护 该 数据 库 的 多 个 版 本 。 我 们 将 在 第 25 章 中 看 到 ，DBMS 一 
般 都 在 其 日 志 里 保存 着 版 本 信息 ， 以 供 恢复 使 用 。 因 此 ， 维 护 这 一 信息 并 不 仅仅 是 为 了 多 版 
本 系统 。 不 过 ， 多 版 本 系统 还 有 其 他 的 需求 ， 就 是 能 以 一 种 有 效 的 方式 访问 较 早 的 版 本 。 

”问题 在 于 如 何 来 提供 合适 的 版 本 来 满足 某 个 读 取 请 求 。 为 了 做 到 这 一 点 ， 系 统 使 用 一 种 

延迟 更 新 的 技术 ， 并 维护 一 个 所 谓 的 版 本 计数 器 (Version Counter，VC)， 每 当 某 个 读 / 写 型 
事务 Tavw 提 交 时 ， 它 就 会 递增 。 这 时 ， 每 个 被 修改 的 数据 项 的 新 版 本 就 会 在 人 该 数据 库 中 ， 
并 将 加 入 版 本 号 N， 这 个 N 值 是 从 (递增 后 的 ) VC 获得 的 。 此 数据 项 的 旧版 本 仍然 《也许 在 
HER) 保存 着 。Taw 创 建 了 该 数据 库 的 一 个 新 版 本 〈【 即 快照 )， 标 有 快照 号 N， 其 中 包括 被 
更 新 的 数据 项 的 新 版 本 和 其 他 数据 项 的 最 新 版 本 《在 Taw 提 交 时 刻 )。 快 照 包含 的 都 是 已 提交 
的 值 。 每 个 只 读 型 事务 赋予 快照 的 是 其 第 一 次 请 求 读 取 时 的 值 ， 而 所 有 后 来 的 读 取 请 求 都 可 
以 利用 从 该 快照 所 获得 的 值得 到 满足 。 

图 24-11 解 释 了 这 种 情况 ,其 中 显示 了 数据 库 的 三 个 数据 项 xz、?y 和 z。 每 个 数据 项 都 标记 着 
一 个 版 本 号 。Tao 在 VC 值 为 4 的 时 候 提出 它 的 首次 读 请 求 。 因 此 ， 它 的 快照 号 是 4， 它 当即 得 
到 了 虚线 上 方 的 该 版 本 的 x、? 和 z。 在 To 正在 执行 时 创建 了 版 本 5 和 6， 但 是 Two 是 无 法 看 到 它 


| 们 的 。 





存储 每 个 数据 库 项 的 版 本 号 都 会 产生 管理 开销 。 此 外 ， 考 虑 到 实用 性 ， 可 以 访问 的 早期 
版 本 的 数目 也 许 会 有 限制 ; 因此 ， 对 于 从 很 陈旧 的 版 本 抽取 信息 的 某 个 (长 时 间 运 行 的 ) 只 读 型 
事务 来 说 ， 若 那个 版 本 不 可 以 再 使 用 的 话 ， 该 事务 不 得 不 异常 中 止 。 

该 控制 具有 一 个 非常 好 的 特点 ， 那 就 是 只 读 型 事务 不 需要 获得 任何 锁 。 正 是 由 于 这 个 原 
因 ， 只 读 型 事务 从 不 需要 等 待 ， 而 读 / 写 型 事务 也 从 不 需要 等 待 只 读 型 事务 。 这 一 特点 的 代价 
是 产生 更 加 复杂 的 并 发 控制 ， 维 护 带 版 本 号 的 多 版 本 需要 额外 的 存储 空间 ， 以 及 由 于 只 读 型 
事务 的 可 串 行 化 顺序 不 同 于 提交 顺序 会 产生 有 些 不 自然 的 行为 。 例 如 ， 一 个 报告 银行 账户 余 
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额 的 只 读 型 事务 可 能 比 某 个 银行 存款 事务 的 提交 时 间 晚 ， 但 是 它 不 会 报告 存款 的 结果 ， 因 为 
它 在 存款 事务 开始 之 前 就 已 执行 了 它 的 首次 读 取 。 





图 24-11 在 多 版 本 数据 库 中 满足 某 个 读 取 请 求 


24.5.2 读 取 一 致 性 的 多 版 本 并 发 控制 

对 于 可 以 容忍 不 可 重复 读 取 (因此 也 是 不 可 串 行 化 调度 ) 的 应 用 程序 来 说 ， 一 些 商 用 
DBMS (比如 Oracle) 都 采用 一 种 称 为 读 取 一 致 性 (Read-Consistency) 的 算法 ， 它 拓展 了 处 
理 读 / 写 型 事务 的 只 读 型 控制 。 

。 对 于 只 读 型 事务 的 处 理 与 在 只 读 型 控制 中 一 样 ， 因 此 也 提供 事务 级 的 读 一 致 性 。 

“ 读 / 写 型 事务 里 的 写 人 语句 对 于 被 写 人 的 数据 项 ， 则 是 对 其 最 新 版 本 使 用 长 期 写 人 锁 。 

某 个 试图 改写 已 被 其 他 事务 施加 写 锁 的 数据 项 的 事务 ， 则 必须 等 待 。 
* 读 / 写 型 事务 里 的 读 取 语句 不 需要 使 用 读 锁 。 相 反 ， 每 个 读 请 求 都 是 由 被 请 求 项 的 最 近 
版 本 值 提供 的 。 

读 一 致 性 供 了 READ COMMITTED 隔 离 级 别 的 一 个 扩展 的 实现 (同时 也 是 Oracle 提 供 的 
READ COMMITTED 的 实现 )。 正 如 24.2 节 给 出 的 READ COMMITTED 级 的 加 锁 实 现 一 样 ， 写 
锁 是 长 期 的 ， 而 且 读 取 返 回 的 是 已 提交 的 值 。 然 而 ， 读 一 致 性 对 于 只 读 型 事务 所 提供 的 是 事 - 
务 级 的 读 取 一 臻 性， 而 这 却 是 READ COMMITTED 级 的 加 锁 实现 所 不 能 提供 的 (也 不 是 
READ COMMITTED 的 ANSI 定 义 所 要 求 的 )。 

读 一 致 性 的 一 个 很 好 的 特点 是 ， 任 何事 务 都 不 需要 对 读 操作 加 锁 。 因 此 ， 读 取 从 不 需要 
等 待 写 人 ,而 写 人 也 从 不 需要 等 待 读 取 。 就 像 在 READ COMMITTED 级 那样 ， 由 读 / 写 型 事务 
执行 的 读 取 是 不 可 重复 的 ; 因此 ， 调 度 有 可 能 是 不 可 串 行 化 的 。 例 如 ， 图 24-6 的 调度 就 显示 
了 这 种 控制 有 可 能 会 产生 的 更 新 丢失 问题 。 


24.5.3 SNAPSHOT 隔 离 级 别 


相同 思想 的 还 有 另 一 种 变形 方案 ， 称 之 为 SNAPSHOT 隔 离 性 [Berenson et al. 1995]。 包 括 
Oracle 在 内 的 一 些 数据 库 供 应 商 已 经 实现 了 SNAPSHOf 隔离 性 的 变形 方案 。 该 方法 是 建立 在 
以 下 两 个 原则 的 基础 上 的 : 

* 每 个 事务 的 所 有 读 取 都 是 利用 该 事务 首次 提出 读 取 请 求 时 的 数据 库 的 快照 来 满足 的 。 l 
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此 ， 所 有 的 事务 都 提供 了 事务 级 的 读 一 致 性 。 

。 每 个 事务 的 写 人 必须 满足 先 提 交 者 赢 (first-committer-wins) 的 原则 。 事 务 T 只 有 当 没 

有 任何 其 他 事务 会 在 Ti 第 一 次 提出 读 取 请 求 与 要 求 提 交 之 间 请 求 提 交 ， 或 者 更 新 了 某 个 

Ti 也 对 之 更 新 的 数据 项 的 时 候 ， 才 允许 提交 。 否 则 ，T, 就 会 异常 中 止 。 数 据 项 既 可 以 是 

一 个 行 ， 也 可 以 是 一 张 表 。 但 由 于 表 对 确定 事务 之 间 的 交互 所 提供 的 是 较 粗 的 粒度 ， 这 

就 会 对 性 能 产生 负面 的 影响 ， 所 以 今后 我 们 总 是 假设 数据 项 是 行 。 

先 提交 者 赢 原则 对 消除 更 新 丢失 起 着 重要 作用 。 在 图 24-6 中 ，T 是 不 允许 提交 的 ， 因 为 它 
要 求 更 新 数据 项 t， 可 是 T: 对 t 的 更 新 和 提交 请 求 ， 却 是 在 Ti 首次 请 求 读 取 后 和 Ti 请 求 提 交 前 提 
出 的 。 

先 提交 者 赢 原则 可 以 在 没有 写 入 锁 的 情况 下 实现 。 一 旦 某 个 事务 T! 完 成， 就 验证 是 否 强 
制 贯彻 先 提交 者 赢 原 则 (就 像 在 某 个 乐观 型 并 发 控制 里 一 样 ， 但 却 是 另外 的 一 种 验证 标准 )。 
验证 可 以 通过 比较 T 的 快照 号 和 T, 更 新 过 的 每 个 数据 项 的 版 本 号 来 实现 。 

。 假 设 当 T, 请 求 提交 时 ， 某 些 T, 更 新 的 数据 项 的 版 本 号 比 T 的 快照 号 要 大 。 这 就 意味 着 ， 

存在 事务 T,， 它 在 T! 的 快照 产生 之 后 写 信 了 那些 数据 项 ， 并 已 提交 了 。 在 这 种 情况 下 ， 

Ti 必须 异常 中 止 ， 因 为 T; 是 先 提交 者 ， 所 以 它 赢 。 

“假设 当 并 请 求 提 交 时 ， 所 有 Ti 写 人 的 数据 项 的 版 本 号 都 小 于 或 等 于 T 的 快照 号 。 只 有 在 

这 种 情况 下 ， 才 允许 T, 提 交 。 

正如 图 24-11 所 显示 的 ， 如 果 T 的 快照 号 是 4， 而 Ti 已 经 写 人 了 x 和 >， 那 么 T 的 提交 的 请 求 
会 遭 到 拒绝 。 因 为 尽管 * 还 没有 更 新 的 版 本 ， 可 是 ?的 一 个 更 新 的 版 本 已 被 在 Ti 执行 时 就 已 提 
交 的 另 一 个 事务 创建 出 来 了 。 

与 采用 乐观 型 并 发 性 控制 算法 一 样 ， 这 种 控制 具有 不 需要 任何 锁 的 特性 。 因 此 ， 无 论 是 
读 取 还 是 写 人 都 不 需要 等 待 ， 但 事务 也 可 能 在 其 任务 完成 时 异常 中 止 。 

尽管 SNAPSHOT 隔 离 性 消除 了 很 多 异常 ， 可 是 它 不 能 确保 所 有 的 调度 都 是 可 串 行 化 的 ， 
因此 ， 事 务 可 能 会 不 正确 地 执行 。 例 如 ， 在 图 24-12 中 ，T, 和 Ts 是 从 同一 个 储户 4 所 拥有 的 余 
额 为 41/ 和 a 的 两 个 不 同 的 账户 取款 的 银行 取款 事务 。 银 行 有 一 条 业务 规则 : 个 人 账户 的 余额 可 
以 是 负 的 , 但 是 每 个 储户 所 拥有 的 所 有 账户 的 总 余额 必须 是 非 负 的 。 因 此 ， 如 果 d 有 两 个 账户 ， 
Aata > 0 的 约束 。Ti 和 T: 都 是 一 致 的 : 在 进行 取款 前 ， 它 们 都 要 读 取 两 个 账户 中 的 余额 ; 
所 以 ， 当 单独 执行 时 ， 它 们 都 符合 该 约束 。 在 此 例 中 ， 每 个 账户 最 初 都 有 $10， 因 此 ， 每 个 事 
务 都 得 出 “取款 $15 是 安全 的 ”结论 。 然而， 正如 我 们 所 看 到 的 ， 该 调度 是 允许 SNAPSHOT 
隔离 性 的 (因为 Ti 和 T? 是 对 不 同 的 数据 项 写 入 )， 可 是 最 终 c2 和 az 的 值 都 是 $-5， 这 是 违背 约束 
的 。 请 注意 ， 这 种 调度 不 是 可 串 行 化 的 。 因 为 一 方面 T: 必 须 在 Ti 的 后 面 (因为 T, 写 入 a 在 T, 读 
取 w 之 后 发 生 )， 而 另 一 方面 Ti 又 必须 在 T: 的 后 面 (HAT SAUEET RRO Z BRA). Ož 
个 例子 的 后 续 讨 论 ， 请 见 练习 24.27。) 


Ti: ra : 10) raz:10) wa: -5) ”提交 


Tz r(a,: 10) r(az : 10) w(a, : ~5) 提交 





图 24-12 不 可 申 行 化 并 导致 某 个 不 一 致 数据 库 的 SNAPSHOT 隔 离 性 调度 
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1. SNAPSHOT 隔 离 性 与 隔离 级 现象 

尽管 图 24-12 的 例子 显示 ，SNAPSHOT 隔 离 性 可 能 会 产生 不 可 串 行 化 (因而 不 正确 ) 的 调 
度 ， 但 值得 注意 的 是 ，SNAPSHOT 隔 离 级 的 调度 并 不 展示 任何 与 较 低 隔离 级 有 关 的 坏 现 
象 一 一 脏 读 、 不 可 重复 读 和 幻影 (还 有 不 属于 隔离 级 定义 的 脏 写 和 更 新 的 丢失 ) 。 

必须 证 清 的 是 ，SNAPSHOT 隔 离 性 确实 不 允许 幻影 。 在 SNAPSHOT 隔 离 级 调度 中 ， 一 
事务 T 可 能 执行 基于 某 个 谓词 的 SBLECT 语 句 ， 而 一 个 并 发 事务 也 有 可 能 插入 满足 那个 谓词 的 
某 个 元 组 ! (这 似乎 是 一 个 幻影 )。 可 是 ，T 是 看 不 见 t 的 ， 哪 怕 它 在 插入 之 后 立即 再 读 取 同一 个 
谓词 。 因为 它 的 所 有 的 读 取 都 是 通过 T 第 一 次 读 取 时 的 快照 来 得 到 满足 的 。 正 是 基于 这 一 原因 ， 
我 们 可 以 说 ，t 不 是 幻影 。 我 们 给 出 两 个 例子 ， 一 个 是 插入 这 样 的 一 个 元 组 并 不 会 导致 不 正确 
的 调度 ， 而 另 一 个 则 会 导致 不 正确 的 调度 。 

*24.1.1 节 的 幻影 的 例子 涉及 Mary 和 她 的 账户 ， 该 例子 在 SNAPSHOT 隔 离 级 别 是 可 以 正确 

执行 的 。 在 该 例 中 ， 将 TotalBalance (总 余额 ) 与 Mary 的 所 有 账户 总 余额 进行 比较 的 事 
务 T! 看 到 了 不 一 致 的 数据 ， 因 为 有 一 个 幻影 插入 到 它 的 两 个 SELECT 语 句 中 间 。 然 而 ， 
SNAPSHOT 隔 离 级 别 能 够 确保 事务 级 的 读 一 致 性 。T, 看 到 的 是 一 个 与 T 刚 开始 时 的 一 样 
的 一 致 的 数据 库 快照 。 它 确实 看 不 到 幻影 ， 因 此 也 不 会 看 到 更 新 过 的 TotalBalance 值 。 
所 以 ， 它 可 以 正确 地 执行 . 

。 假 设 银行 数据 库 有 一 个 完整 性 约束 (与 银行 的 某 个 业务 规则 相对 应 )， 即 任何 储户 不 能 
拥有 10 个 以 上 的 账户 。 为 了 保证 这 个 约束 ，add_new_account 事 务 总 是 先 使 用 谓词 
Name = Mary 执行 一 个 SELECT 语句 ， 以 确定 Mary 的 账户 数目 。 如 果 该 数目 小 于 等 于 9， 
它 便 会 播 入 与 Mary 的 新 账户 相对 应 的 一 个 元 组 。 现 在 假设 add_new_account 事 务 有 两 个 
实例 Ti 和 T:， 它 们 在 SNAPSHOT 隔 离 级 别 并 发 执行 ，Mary 的 最 初 账户 数 为 9。 由 于 每 个 
事务 都 确定 账户 数 为 9， 因 此 都 插入 了 与 新 账户 相对 应 的 一 个 元 组 。 于 是 Mary 现 在 有 了 
11 个 账户 ， 这 和 完整 性 约束 是 冲突 的 ， 所 以 调度 是 不 可 串 行 化 的 ， 也 是 不 正确 的 。 

对 于 幻影 的 组 成 ， 在 文献 中 还 没有 一 致 的 定义 。 有 些 资料 认为 ， 如 果 某 个 事务 两 次 执行 
同一 个 SELECT 语句 ， 第 二 次 执行 可 能 返回 一 个 包含 有 某 个 幻影 元 组 的 结果 集合 ， 而 这 个 元 
组 在 第 一 次 执行 返回 的 结果 集合 中 却 没 有 ， 那 么 隔离 级 别人 允许 幻影 。 采 用 这 样 的 定义 ， 幻 影 
在 REPEATABLE READ 级 是 允许 的 ， 但 在 SNAPSHOT 隔 离 级 是 不 允许 的 。 因 为 执行 同一 个 
SELECT 语句 两 次 的 事务 总 是 会 获得 同样 的 结 RE (因为 两 个 SELECT 语 名 访问 的 是 同一 个 
快照 )。 

然而 ， 上 述 第 二 个 例子 说 明 ， 幻影 的 影响 在 SNAPSHOT 隔 离 级 还 是 存在 的 ， 虽然 根据 以 
上 的 定义 ， 插 入 的 确 没有 构成 幻影 。 倘 若 我 们 在 那个 例子 中 在 REPEATABLE READ 级 执行 该 
事务 ， 就 会 允许 出 现 同样 的 (不 可 串 行 化 的 ) 调度 ， 因 此 我 们 说 幻影 确实 存在 。 

一 且 采 用 基于 相继 执行 SELECT 语句 的 幻影 定义 ， 就 允许 SNAPSHOT 隔 离 级 不 展示 较 低 . 
层 的 隔离 级 所 定义 的 任何 不 好 的 现象 。 然 而 ， 它 并 不 满足 ANSI 定 义 的 SERIALIZABLE[SQL 
1992]， 该 定义 认为 ，SERIALIZABLE 必 须 提 供 “ 在 完备 的 可 串 行 化 执行 场合 里 众所周知 的 ” 
那些 东西 〈 此 外 还 不 允许 以 下 三 种 现象 中 的 任何 一 种 )。 这 当然 不 是 SNAPSHOT 隔 离 级 别 的 情 
况 。 不 包含 脏 读 、 不 可 重复 读 和 幻影 三 种 现象 的 调度 ， 有 时 候 称 为 异常 可 串 行 化 (anomaly 
serializable ) 。 因此 ， SNAPSHOT 隔 离 级 的 调度 是 异常 可 串 行 化 ， 但 不 一 定 是 可 串 行 化 的 。 
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这 再 次 表明 ， 执 行 的 正确 性 不 应 该 通过 有 没有 出 现 其 一 特定 的 现象 来 定义 。 有 些 作者 采 
用 写 入 偏差 (write skew) 的 说 法 来 描述 图 24-12 所 例 举 的 不 好 现象 ， 但 是 即便 把 那些 现象 都 
添加 到 列表 中 ， 也 不 能 认为 这 样 的 列表 就 是 完备 的 。 例 如 ， 图 24-13 中 的 调度 在 SNAPSHOT 
隔离 级 别 是 允许 的 ， 但 它 是 不 可 串 行 化 的 ， 因 为 它 的 可 串 行 化 图 (serialization graph) 有 一 
个 循环 : 
Ta 一 IT”TimTs 
然而 ， 这 个 调度 却 没有 展示 出 任何 命名 过 的 现象 ， 包 括 (通常 定义 的 ) SAME. 


Ti r) wa) 提交 


Tx r(x) ry) 
Ty: r(x) r(y) wiz) 提交 





图 24-13 不 可 串 行 化 但 并 不 展示 任何 已 命名 异常 情况 的 SNAPSHOT 隔 离 级 调度 


2. SNAPSHOT K $ Aa FR 

我 们 在 第 23 章 讨论 带 有 冲突 的 操作 时 强调 过 ， 在 读 取 和 写 人 操作 之 间 有 三 种 冲突 形式 
(尽管 当时 我 们 并 没有 对 它们 进行 命名 )。 

。 读 / 写 型 冲突 。T, 写 入 了 Ti 先前 已 读 取 的 某 个 数据 项 ， 因 此 无 论 按 什么 顺序 ， 它 都 必须 排 

在 T 的 后 面 。 

。 写 / 读 型 冲突 ”Ts 读 取 了 T) 先 前 已 写 入 的 某 个 数据 项 ， 因 此 无 论 按 什么 顺序 ， 它 都 必须 排 

在 Ti 的 后 面 。 

“ 写 / 写 型 冲突 ” 卫 写 人 了 Ti 先前 已 写 人 的 某 个 数据 项 ， 因 此 无 论 按 什么 顺序 ， 它 都 必须 排 

在 T; 的 后 面 。 | 

与 其 他 隔离 级 别 有 关 的 任何 现象 在 SNAPSHOT 隔 离 级 别 所 产生 的 调度 中 不 会 展示 的 一 个 
原因 是 : 在 并 发 执行 的 事务 中 可 能 出 现 的 唯一 冲突 是 读 / 写 型 冲突 (在 彼此 不 是 并 发 执行 的 事 
务 中 间 ， 还 允许 出 现 其 他 类 型 的 冲突 )。 

。 写 / 读 型 冲突 不 可 能 发 生 ， 因 为 T; 是 通过 它 开始 时 所 得 到 的 数据 库 快 照 来 读 取 数据 项 值 

的 。 由 于 Ts 和 Tl 是 并 发 执行 的 ， 因 此 那个 快照 确实 不 包含 T! 写 入 该 数据 项 后 的 值 。 

。 写 / 写 型 冲突 不 可 能 发 生 ， 这 是 由 于 先 提 交 者 赢 特 性 的 缘故 。 

在 图 24-12 的 调度 中 ， 有 一 个 写 人 偏差 ， 

。 卫 与 TI 有 一 个 读 / 写 型 冲突 ， 因为 也是 在 T* 读 取 后 才 写 人 az 的 。 

*。T, 与 TI 有 一 个 读 / 写 型 冲突 ， 因为 T, 是 在 T 读 取 后 才 写 入 a 的 。 

图 24-13 的 调度 更 加 有 趣 。 

。T 与 T, 有 一 个 读 / 写 型 冲突 ， 因 为 T 在 T, 读 取 后 才 写 人 x。 

“T: 与 T; 有 一 个 读 / 写 型 冲突 ， FLAT FET RMA BS Ay. 

。Ts: 与 有 一 个 写 / 读 型 冲突 ， 因 为 Ts 在 Ti 写 人 后 才 读 取 x。 oo 
最 后 的 这 种 冲突 ， 同 并 发 事务 中 间 不 能 发 生 写 / 读 型 冲突 的 说 法 并 不 矛盾 。 因 为 T;: 与 T, 不 是 并 
发 执行 的 ， 它 是 在 Ti 提交 之 后 才 开 始 的 。 

这 两 个 例子 可 以 概括 地 说 明 如 下 [Fekete et al. 2000]: 在 每 个 不 可 串 行 化 的 SNAPSHOT 隔 
离 级 调度 中 ， 其 串 行 图 中 包含 环 。 这 个 环 中 至 少 包含 两 个 并 发 执行 的 事务 之 间 的 读 / 写 型 冲突 ， 
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也 可 以 包含 非 并 发 执行 的 事务 之 间 产 生 的 一 些 读 / 写 型 、 写 / 读 型 或 者 写 / 写 型 冲突 。 

3. 在 SNAPSHOT 隔 离 级 别 中 正确 执行 

注意 ， 在 24.2.2 节 给 出 的 四 个 例子 都 是 可 以 在 SNAPSHOT 隔 离 级 别 正确 运行 的 。 

*。 一 个 打印 TRANSCRIPT 的 事务 能 够 正确 工作 ， 因 为 它 是 只 读 的 ， 并 可 看 到 该 数据 库 的 某 个 

快照 。 
“注册 事务 T 能 够 正确 地 工作 ， 因 为 
“如 果 某 个 事务 T' 在 IT 第 一 次 发 出 读 取 请 求 后 修改 REQUIRES 或 者 TRANSsCRIPT， 那 么 它 所 
产生 的 最 终 调度 等 价 于 串 行 调度 T，T'。 
“如 果 某 个 并 发 的 广 册 事务 试图 给 学 生 注 册 同 一 门 课 程 ， 它 会 更 新 CLAss 的 同一 行 ， 但 
只 有 一 个 注册 事务 允许 提交 。 

“重新 分 配 教室 的 事务 T 能 够 正确 地 工作 ， 因 为 
“如 有 果 某 个 事务 工 在 IT 第 一 次 发 生 读 取 请 求 后 修改 CLASS 或 者 CLASSRooM， 那 么 它 所 产生 
的 最 终 调度 等 价 于 串 行 调度 T，T'。 
*T 不 可 能 干涉 并 发 注册 事务 ， 因 为 两 者 都 是 更 新 CLAss 的 同一 个 行 ， 而 只 有 一 个 允许 
提交 。 

。 审 计 事务 可 以 正确 地 工作 ， 因 为 它 是 只 读 型 的 ， 并 能 够 看 到 该 数据 库 的 某 个 快照 。 

一 个 应 用 程序 在 SNAPSHOT 隔 离 级 别 总 是 能 够 正确 运行 ， 即 便 它 的 一 些 调度 出 现 了 写 入 
偏差 ， 或 者 是 不 可 串 行 化 的 。 例 如 ， 考 虑 某 个 包含 一 个 音乐 会 座位 预订 事务 的 应 用 程序 。 该 
事务 检查 座位 的 数目 ， 并 预订 一 个 座位 。 完 整 性 约束 规定 : 同一 个 座位 不 能 被 多 个 人 预订 。 
假设 两 个 票务 预订 事务 并 发 执行 ， 并 产生 如 图 24-14 所 示 的 调度 (事实 上 等 价 于 图 24-12 的 调 
度 )。 每 个 事务 都 读 取 对 应 于 座位 s, 和 ss 的 元 组 ， 并 确定 它们 都 未 被 预订 (U)。 然 后 ，Ti 通 过 在 
数据 库 中 将 其 状态 更 新 为 R 来 预订 s1; Tz 也 用 同样 的 方式 预订 s。 对 于 该 应 用 程序 来 说 ， 这 一 
调度 是 正确 的 ， 尽 管 出 现 了 某 个 写 人 偏差 (因此 该 调度 不 是 可 串 行 化 的 )。 此 外 ， 由 于 先 提交 
者 赢 的 原则 在 维护 着 完整 性 约束 ， 所 以 ， 如 果 两 个 事务 都 想 要 预订 座位 9 ， 那 么 只 有 其 中 的 一 
个 事务 会 提交 。 因 此 ， 票 务 预订 事务 的 任何 调度 在 SNAPSHOT 隔 离 级 都 能 够 正确 地 执行 。 






T: re U) (s: U) wo :R) 提交 
Ty: r(s,: U) r(s2: U) wsi: R) 提交 


图 24-14 某 票 务 预订 应 用 程序 的 SNAPSHOT 隔 离 级 调度 。 它 展示 了 写 和 偏差， 
是 不 可 串 行 化 的 ， 但 却 是 正确 的 


由 于 SNAPSHOT 隔 离 级 的 多 版 本 特点 ， 可 串 行 化 SNAPSHOT 隔 离 级 调度 有 时 候 可 能 会 产 
生 不 太 直 观 的 行为 。 例 如 ， 图 24-15 的 调度 按照 顺序 
T:>T:>T, 
me TERT, STE, (即使 它 在 Ti 提交 后 才 开 始 )。 
事实 上 ， 许 多 应 用 程序 在 SNAPSHOT 隔 离 级 都 能 正确 运行 ， 倘 若 绝 大 多 数 的 完整 性 约束 
以 代码 形式 融和 人 到 数据 库 模式 里 的 话 ( 见 练习 24.27)， 那 就 更 是 如 此 。 然 而 ， 谨 慎 的 设计 者 
在 制定 设计 决策 之 前 ， 都 会 进行 仔细 的 分 析 。 
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Ti w w(x) 提交 


Tz r(x) r(y) 
T;: . rO) w(z) 提交 





图 24-15 可 串 行 化 的 SNAPSHOT 同 离 级 调度 ， 尽 管 T; 在 Ti 提交 后 开始 ， 
但 在 等 价 串 行 顺序 中 却 先 于 T， 


24.6 参考 书目 


幻影 与 利用 谓词 锁 消 除 幻 影 是 在 [Eswaran et al. 1976] 里 介绍 的 。SQL 隔 离 级 别 的 定义 可 以 在 [Gray et 


al. 1976] 和 ANSI SQL 标准 [SQL 1992] 中 找到 。 隔 离 级 的 加 锁 实现 在 [Berenson et al. 1995] 中 讨论 。 在 [Gray 
et al. 1976] 里 包含 关于 粒度 加 锁 的 详细 论述 。 多 版 本 并 发 控制 在 [Bernstein and Goodman 1983, ，Hadzilacos 
and Papadimitriou 1985] 中 加 以 介绍 。 多 版 本 乐观 型 并 发 控制 的 设计 在 [Agrawal et al. 1987] 中 有 所 描述 。 
SNAPSHOT 隔 离 级 是 在 [Bernstein et al. 2000] 中 首先 提出 的 。[Fekete et al. 2000] 中 讨论 了 SNAPSHOT 隔 离 
级 的 冲突 问题 ， 并 给 出 了 SNAPSHOT 师 离 级 别 的 调度 为 可 串 行 化 的 一 个 充分 条 件 。[Bernstein et al. 2000] 
还 讨论 了 基于 事务 的 语义 证 明 低 隔离 级 调度 正确 性 的 一 种 方法 。[Bernstein et al. 1987] 对 包括 索引 加 锁 在 
内 的 许多 并 发 控制 算法 进行 了 精 胖 论述 。 关 于 对 象 数据 库 的 并 发 性 问题 可 参见 [Cattell 1994]. 


24.7 练习 


24.1 


24.7 


24.8 


24.9 


假设 学 校 的 事务 处 理 系统 包含 一 张 表 ， 每 个 目前 已 注册 学 生 都 对 应 于 该 表 中 的 一 个 元 组 。 

a. 估计 一 下 ， 要 存储 这 张 表 需 要 多 大 的 磁盘 空间 ? 

b. 请 给 出 在 对 表 进行 并 发 控制 场合 ， 必 须 对 整个 表 加 锁 的 事务 的 例子 。 

请 给 出 在 一 组 记录 组 成 的 非 关 系数 据 库 里 出 现 幻影 的 例子 ， 该 数据 库 中 每 个 记录 包含 若干 字段 。 
对 于 比 SERIALIZABLE 级 别 低 的 每 个 隔离 级 别 ， 请 对 曾经 遇 到 过 的 产生 出 错 的 情况 ， 给 出 事务 处 
理 系 统 的 排序 的 例子 (不 能 是 银行 或 学 生 注册 系统 )。 

假设 事务 在 REPEATABLE READ 级 执行 。 请 给 出 出 现 幻影 的 事务 例子 ， 其 中 事务 执行 着 用 
WHERE 子 句 来 指定 主键 值 的 某 全 SELECT 语句 。 | 

假设 事务 在 REPEATABLE READ 级 执行 。 请 给 出 出 现 幻影 的 事务 例子 ， 其 中 事务 执行 着 删除 满足 
某 谓词 P 的 若干 元 组 的 某 个 DELETE 语 句 。 

假设 事务 在 REPEATABLE READ 级 执行 。 请 给 出 出 现 幻影 的 例子 ， 其 中 事务 T: 执 行 的 UPDATE 语 
名 将 导致 事务 Ti 执行 UPDATE 语 名 会 产生 一 个 幻影 。 . 

假定 每 个 表 都 拥有 三 个 属性 attr1 、attr2 和 attr3 的 两 张 表 TABLE1 与 TABLE2 组 成 一 个 模式 ， 并 假定 有 
如 下 语句: l f 

SELECT Ti.attri, T2.attri 

FROM TABLE1 Ti, TABLE2 T2 


“WHERE Ti.attr2 = T2.attr2 AND Tl.attr3 = 5 


AND T2.attr3 = 7 
请 给 出 将 产生 幻影 的 一 个 INSERT 语 句 的 例子 。 
试 述 不 可 重复 读 与 幻影 之 间 的 区 别 。 特 别 地 ， 请 给 出 能 阐释 这 两 种 情况 的 若干 事务 的 SQL 语句 的 
调度 的 例子 。 指 定 每 种 情况 的 隔离 级 。 
请 给 出 采用 SELECT 语 名 的 应 用 例子 ， 要 求 其 中 应 用 的 语义 蕴涵 着 不 可 能 出 现 幻影 。 
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24.10 


24.11 


24.12 


24.13 
24.14 


24.15 


24.16 


24.17 


24.18 


POR FH AE 


我 们 在 24.2.2 节 里 提 到 ， 在 READ COMMITTED 级 执行 的 注册 事务 不 会 干扰 在 REPEATABLE 
READ 级 执行 的 教室 重 分 配 事务 的 正确 性 。 请 说 明 原因 。 

在 实现 意向 锁 的 DBMS 里 ， 请 说 明 为 什么 两 个 不 同 的 事务 可 以 同时 对 同一 个 表 施 加 IX 锁 ， 而 不 会 
引起 冲突 ? 

请 说 明 ， 一 个 事务 所 请 求 的 对 表 施 加 的 谓词 锁 ， 在 什么 条 件 下 会 由 于 另 一 个 事务 拥有 对 同一 张 表 
的 谓词 读 锁 而 遭 到 拒绝 ? 

对 于 实现 隔离 级 的 每 种 锁 ， 请 叙述 为 什么 需要 有 1S 锁 以 及 何 时 可 以 将 其 释放 ? 

下 述 过 程 是 为 获得 读 锁 而 提出 的 : 

当 一 个 SQL 语句 读 取 某 表 中 满足 某 谓 词 的 元 组 集 时 ， 系 统 首先 对 包含 这 些 元 组 的 表 施 加 IS 锁 ， 然 
后 再 对 其 中 每 一 个 元 组 施加 S 锁 。 

请 解释 ， 为 什么 这 个 过 程 允许 出 现 幻影 ? 

请 给 出 通过 一 个 只 读 多 版 本 并 发 控制 所 产生 的 调度 的 例子 ， 要 求 其 中 的 读 / 写 事务 是 按 其 提交 的 
顺序 串 行 化 的 ， 然 而 其 只 读 型 事务 却 是 按 不 同 的 顺序 串 行 化 的 。 

请 给 出 一 个 可 以 为 多 版 本 并 发 控制 所 接受 的 读 / 写 请 求 调度 的 例子 ， 其 中 事务 T, 在 事务 T, 提 交 之 后 
才 开始 ， 但 按 串 行 顺序 Ti, 却 在 T: 之 前 。 这 样 的 调度 可 能 会 有 以 下 的 违反 直觉 的 行为 (尽管 它 是 可 
串 行 化 的 ): 你 向 自己 的 银行 账户 里 存 钱 ; 提交 你 的 事务 ; 后 来 你 又 开始 了 一 个 新 的 事务 ， 以 读 
取 账 户 里 的 总 额 ， 结 果 却 发 现 你 存 的 钱 没有 在 总 额 中 反映 出 来 。( 提示: 此 调度 允许 包含 有 附加 
的 事务 。) 

请 说 明 ， 图 24-12 所 示 的 在 SNAPSHOT 隔 离 级 不 正确 执行 的 调度 可 能 在 OPTIMISTIC READ 
COMMITTED 级 执行 ( 见 24.2.1 节 ) 时 出 现 ， 它 也 将 是 不 正确 的 。 

请 给 出 在 以 下 隔离 级 别 可 以 接受 的 调度 的 例子 : 

a.SNAPSHOT 隔 离 级 别 ， 但 不 是 REPEATABLE READ 级 。 


.b.SERIALIZABLE 级 ， 但 不 是 SNAPSHOT 隔 离 级 别 (提示 : 在 T, 提 交 后 T 完 成 一 次 写 。) 
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一 个 特定 的 只 读 型 事务 读 取 上 个 月 输入 数据 库 里 的 数据 ， 并 用 这 些 数据 来 准备 一 份 报告 。 这 个 事 

务 可 以 最 低 可 以 在 哪 种 隔离 级 别 执行 ? 请 加 以 说 明 。 

请 说 明 ， 由 使 用 某 个 INSENSITIVE 游 标的 单个 SELECT 语句 组 成 的 只 读 型 事务 ， 为 什么 总 是 能 够 

正确 地 在 READ COMMITTED 级 执行 ? 

假设 REPEATABLE READ 级 的 加 锁 实 现 要 求 事务 在 请 求 写 人 时 , 对 某 表 施加 X 锁 ; 当 请 求 读 取 时 ， 

要 求 事务 对 该 表 施 加 IS 锁 ， 以 及 对 返回 的 元 组 施加 S 锁 。 请 说 明 ， 这 时 幻影 不 可 能 出 现 。 

考虑 对 行 和 表 采 用 长 期 粒度 锁 所 实现 的 一 种 隔离 级 别 。 在 什么 条 件 下 有 可 能 出 现 幻影 ? 

a. 请 给 出 两 个 事务 调度 的 一 个 例子 ， 其 中 两 阶段 加 锁 并 发 控制 会 造成 一 个 事务 等 待 ， 但 
SNAPSHOT 隔 离 级 控制 则 会 使 一 个 事务 异常 中 止 。 

b. 请 给 出 两 个 事务 调度 的 一 个 例子 ， 其 中 两 阶段 加 锁 并 发 控制 会 造成 一 个 事务 异常 中 止 ( 因 死 锁 
缘故 )， 但 SNAPSHOT 隔 离 级 控制 则 允许 两 个 事务 都 提交 。 

请 说 明 ， 为 什么 SNAPSHOT 隔 离 级 调度 不 会 出 现 脏 读 、 脏 写 、 丢 失 更 新 、 不 可 重复 读 以 及 

幻影 ? 

考虑 由 不 同 的 隔离 级 的 事务 所 组 成 的 一 个 应 用 。 请 证 明 ，SERIALIZABLE 级 的 事务 相对 其 他 事 

务 来 说 总 是 可 以 串 行 化 的 。 换 句 话 说， 就 是 证 明 ， 对 于 任意 一 个 SERIALIZABLE 级 事务 T 和 其 他 

任何 事务 T'， 两 个 事务 的 任何 调度 都 等 同 于 ，T 的 所 有 操作 要 么 都 在 T' 的 所 有 操作 的 前 面 ， 要 人 么 

都 在 T' 的 所 有 操作 的 后 面 。 
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在 某 些 特 殊 的 应 用 里 ， 所 有 的 事务 都 将 其 读 取 的 全 部 数据 项 改写 。 请 证 明 ， 如 果 这 些 应 用 是 在 
SNAPSHOT 隔 离 级 下 执行 的 话 ， 那 么 已 提交 事务 的 所 有 调度 都 是 可 串 行 化 的 。 

考虑 如 图 24-12 所 示 的 两 个 银行 取款 事务 的 调度 ， 其 中 SNAPSHOT 隔 离 级 将 会 导致 不 一 致 的 数据 
库 。 假 设 银 行 编制 事务 规则 “同一 个 储户 所 拥有 的 全 部 账户 的 余额 的 总 和 必须 为 非 负 ”， 并 将 其 
作为 数据 库 模式 的 完整 性 约束 。 那 么 这 种 特殊 的 调度 是 不 可 能 出 现 的 。 

虽然 现在 保证 了 完整 性 约束 ， 但 特殊 事务 的 规格 说 明 还 规定 ， 当 事务 提交 时 ， 该 数据 库 的 状态 会 
满足 某 个 更 严格 的 条 件 。 请 给 出 更 严格 条 件 的 一 个 例子 ， 它 是 某 个 取款 事务 在 终止 时 强行 施加 的 ， 
并 给 出 两 个 事务 在 SNAPSHOT 隔 离 级 运行 就 可 能 使 它们 的 行为 不 正确 的 调度 的 例子 。 

已 有 人 提出 了 如 下 的 多 版 本 并 发 控制 : 


在 事务 第 一 次 提出 读 取 请 求 时 利用 数据 库 已 经 存在 的 (已 提交 ) 版 本 ， 读 取 能 够 得 
到 满足 。 而 写 入 则 是 受到 表 的 长 期 写 锁 的 控制 。 


这 样 控 制 是 否 始终 产生 可 品行 化 调度 ? 车 答案 否定 ， 请 给 出 一 个 可 能 产生 不 可 串 行 化 调度 的 
CIF. 

我 们 已 经 给 出 过 实现 READ COMMITED 隔 离 级 的 两 种 不 同 的 办 法 : 一 是 在 24.2 节 的 加 锁 实现 ， 
二 是 24.5 节 的 读 取 一 致 性 实现 。 请 给 出 一 个 调度 的 例子 ， 其 中 这 两 种 实现 会 产生 出 不 同 的 结果 。 
粒度 加 锁 协 议 能 够 杜绝 如 下 两 个 事务 之 间 的 死 锁 ， 其 中 一 个 事务 执行 某 个 SELECT 语句 ， 而 另 一 
个 事务 则 执行 某 个 UPDATE 语 句 。 例 如 ， 假 设 一 个 事务 包含 如 下 的 SELECT 语句 : 

SELECT COUNT (P.Id) 

FROM EMPLOYEE P 

WHERE P.Age = '27 

它 返回 年 龄 为 27 的 雇员 人 数 ， 而 另 一 个 则 包含 如 下 的 UPDATE 语 名 : 


UPDATE EMPLOYEE 

SET Salary = Salary * 1.1 

WHERE Department = 'Adm' 

它 给 管理 部 门 的 所 有 雇员 加 薪 10%。 假 定 Department 和 Age 都 存在 着 索引 ， 而 与 部 门 Adm 对 应 的 
元 组 ， 同 年 龄 27 所 对 应 的 元 组 一 样 ,都 是 存放 在 多 个 页 面 上 的 。 

请 说 明 ， 在 非 READ UNCOMMITTED 级 上 为 何 可 能 出 现 死 锁 ? 

请 给 出 在 SNAPSHOT 隔 离 级 执行 的 调度 的 一 个 例子 ， 其 中 的 两 个 事务 都 会 引信 另 一 个 事务 看 不 
到 的 幻影 ， 从 而 产生 不 正确 的 行为 。 假 设 在 SNAPSHOT 隔 离 级 描述 里 所 说 的 数据 项 是 行 。 

在 某 个 Internet 选 举 系统 里 ， 每 个 投票 者 都 以 邮件 形式 发 送 PIN( 个 人 身份 识别 号 )。 当 投票 者 需要 
在 某 个 Web 站 点 投票 时 ， 她 就 输入 其 PIN 和 投票 ， 然 后 就 会 执行 某 个 投票 事务 。 

在 该 投票 事务 里 ， 首 先 检查 PIN ， 以 证 实 它 是 有 效 的 ， 并 非 是 已 经 使 用 过 的 。 然 后 将 投票 累计 到 
相应 的 候选 人 的 积分 榜 上 。 此 时 用 到 两 张 表 ， 一 张 表 包 含有 效 的 PIN ， 同 时 附带 着 该 PIN 是 否 已 
被 用 过 的 指示 标记 ， 而 另 一 张 表 则 包含 候选 人 的 名 字 ， 以 及 每 人 的 投票 积分 榜 。 请 讨论 为 投票 事 
务 选择 合适 的 隔离 级 所 涉及 的 问题 。 倘 若 引 入 一 个 新 的 只 读 型 事务 来 输出 整个 投票 积分 榜 表 ， 请 
讨论 选择 合适 的 隔离 级 时 会 涉及 的 问题 。 i 

某 个 航空 订 票 数据 库 有 两 张 表 : 一 张 表 为 FLiGHTS， 具 有 属性 flt_num、plane_id、 num_reserv; B 
一 张 表 为 PLANES， 具 有 属性 plane_id、num_seats 。 

这 些 属 性 都 有 直观 的 语义 。 预 订 事务 包含 以 下 步骤 : 
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SELECT F.plane_id, F.num_reserv 
INTO :p, :n 
FROM FLIGHTS F 
WHERE F.flt_num = :f 
A. SELECT P.num_seats 
INTO :s 
FROM PLANES P 
WHERE P.plane_id = :p 
B.  ...checkthatn<s... 
C. UPDATE FLIGHTS F 
SET F.num_reserv = : 
WHERE F.flt_num = :f 

D. COMMIT 

假定 每 一 个 SQL 语句 都 在 一 定 的 隔离 级 执行 ， PDBMS 使 用 意向 锁 ， 并 且 对 表 和 行 加 锁 ， 而 宿主 变 

量 f 则 包含 被 预订 的 航班 号 。 该 事务 应 当 不 会 额外 预订 航班 。 

a. 假定 事务 在 READ COMMITTEPD 级 运行 ， 在 A、B 和 D 点 应 持 有 哪 种 锁 ? 

b. 倘 车 并 发 执行 在 READ COMMITTED 级 运行 的 预订 事务 以 某 种 方式 交叉 ， 即 一 个 事务 要 等 到 另 
一 个 事务 执行 到 B 点 完成 才能 开始 执行 ， 那 么 数据 库 会 处 于 不 正确 的 状态 。 请 描述 其 存在 的 
问题 。 

c. 为 了 避免 bp 中 指出 的 问题 ， 将 UPDATE 语 句 里 的 SET 子 名 改 为 


F.num_reserv = F.num_reserv + 1 


现在 预订 事务 是 否 正确 地 在 READ COMMITTED 级 运行 ? 为 什么 ? 

d. 假定 事务 在 REPEATABLE READ 级 运行 ， 而 表 是 通过 索引 访问 的 ， 那 么 在 A、B 和 DD 点 应 对 表 
施加 哪 种 锁 ? 

e. 倘若 在 REPEATABLE READ 级 运行 ，b 中 所 说 的 交叉 会 导致 什么 问题 ? 

ERS (两 个 版 本 ) 都 采用 SNAPSHOT 隔 离 级 运行 ， 那么 b 中 所 说 的 交叉 是 否 也 会 导致 不 正确 
状态 ? 为什么? 

g 为 了 跟踪 每 位 乘客 ， 引 入 一 张 新 的 表 PAssENGER ， 它 用 一 行 描述 每 个 航班 的 每 位 乘客 ， 其 中 包 
| 括 属 性 name、flt_num 和 seat._id。 在 事务 的 最 后 ， 添 加 SQL 语 句 ， 以 便 完成 以 下 任务 : (1) 读 取 f 
所 规定 的 航班 的 每 位 乘客 的 seat_id，(2) 为 每 位 新 乘客 插入 一 行 新 记录 ， 它 为 该 乘客 分 配 一 个 
空 座位 。 使 得 该 事务 不 会 产生 不 正确 状态 《外 两 位 乘客 占据 同一 座位 ) 的 最 低 的 ANSI 隔 离 级 
是 什么 ? 为 什么 ? 

两 个 事务 并 发 地 运行 ， 其 中 每 个 事务 既 可 能 提交 ， 也 可 能 异常 中 止 。 事 务 如 下 : 

Ty: ri(x) wid) 

T: w(x) 

Ta: r) w(x) 

Ta: r(x) Wa(x) w40) 

针对 以 下 的 每 一 种 情况 ， 请 指出 其 最 终 调度 是 否 总 是 可 串 行 化 和 原子 化 的 (yes 或 no)? 

a. TI 和 Ts 都 在 READ UNCOMMITTED 级 运行 。 

b. T; 和 Ts 都 在 READ UNCOMMITTED 级 运行 

c.Ti 和 T: 都 在 READ COMMITTED 级 运行 

d.T, 和 Ts 都 在 READ COMMITTED 级 运行 。 

e.T 和 Ts: 都 在 SNAPSHOT 隔 离 级 运行 。 

f.Ti 和 T4 都 在 SNAPSHOT 隔 离 级 运行 。 
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在 以 前 的 各 章 里 ， 我 们 一 直 作 出 不 切实 际 的 假设 : 事务 总 是 提交 而 且 系 统 永 远 不 会 失灵 。 
现实 是 完全 不 一 样 的 : 事务 可 能 会 由 于 各 种 原因 而 异常 中 止 ， 而 硬件 和 软件 也 会 有 故障 。 这 
类 事件 必须 小 心 应 对 ， 以 确保 事务 的 原子 性 。 此 外 ,海量 存储 设备 很 容易 出 现 故 障 ， 造 成 已 
提交 事务 写 人 数据 库 的 信息 丢失 ， 从 而 威胁 到 持久 性 。 

在 本 章 里 ， 我 们 探讨 为 了 实现 原子 性 和 持久 性 所 必须 解决 的 基本 问题 ， 以 及 实现 原子 性 
和 持久 性 的 一 些 技术 。 我 们 的 目的 并 不 是 介绍 任何 特定 的 故障 恢复 系统 的 设计 。 相 反 ， 我 们 
着 重 强调 这 些 系统 设计 背后 的 若干 指导 原则 。 


25.1 崩溃、 异常 中 止 和 介质 故障 


D E DEEE TEADES, MAMARRO TIE EEEE, 
故障 可 能 是 由 处 理 器 中 的 问题 引起 的 ， 也 可 能 是 由 主 存 中 的 问题 引起 的 (比如 断 电 )， 

能 是 由 软件 中 的 错误 引发 的 。 这 些 故障 会 导致 处 理 器 的 运行 不 可 预测 ; 比如 ， ENDANS 

致 处 理 器 停止 工作 的 操作 之 前 ， 处 理 器 有 可 能 随意 地 把 错误 的 数据 写 在 存储 器 的 某 个 地 方 。 

我 们 把 这 种 故障 称 作 崩溃 .(crash )。 我 们 假设 一 旦 出 现 崩 涡 ， 主 存 中 的 数据 就 丢失 了 。 正 因 

为 如 此 ， 主 存 又 称 为 易 失 型 存储 器 (volatile storage)。 发 生 故 障 的 处 理 器 也 有 可 能 向 海量 存 

储 设 备 写 人 错误 的 数据 。 不 过 这 种 事件 不 太 可 能 出 现 ， 于 是 不 妨 假定 海量 存储 器 的 内 容 并 不 
受 崩溃 之 影响 。 

一 般 来 说 ， 当 事务 处 理 系统 崩溃 时 ， 有 一 些 事务 仍 处 于 活动 状态 。 这 就 意味 着 数据 库 将 
处 于 不 一 致 的 状态 。 当 系统 崩溃 后 重新 启动 时 ， 在 尚未 执行 恢复 程序 (recovery procedure) 
把 数据 库 复原 到 一 致 状态 之 前 ， 系 统 的 服务 是 无 法 继续 的 。 设 计 恢 复 程序 的 一 个 主要 问题 是 ， 
如 何 处 置 发 生 贿 溃 时 还 处 于 活动 状态 的 事务 T? 原子 性 要 求 恢 复 程序 要 么 让 T 继 续 执 行 ， 直 到 
它 全 部 完成 一 一 称 之 为 前 滚 (rollforward) ; 
回 退 (rollback), 

前 滚 虽 然 并 非 不 可 能 ， 但 实现 起 来 是 非常 困难 的 。 如 果 T 是 一 个 交互 性 的 事务 ， 那 么 继续 
执行 就 还 需要 终端 用 户 的 配合 。 用 户 必须 知道 ， 崩 省 前 用 户 所 请 求 的 更 新 操作 中 ， 有 哪些 已 
实际 记录 到 数据 库 里 ; 并 从 该 点 开始 继续 提交 请 求 。 在 崩溃 时 刻 ， 事 务 的 本 地 状态 (ITHE 
地 变量 的 状态 ) 有 可 能 是 存放 在 易 失 型 存储 器 里 的 ， 故 而 很 可 能 已 经 委 失 。 这 样 ， 前 滚 一 个 
事务 就 变 得 更 加 困难 。 除 非 T 的 本 地 变量 的 状态 得 到 复原 ， 否 则 从 出 省 发 生 的 那 一 点 继续 执行 
事务 T 是 不 可 能 的 。 这 样 ， 为 了 在 崩溃 后 能 够 前 深 事 务 T， 必须 采取 特别 的 措施 ， 在 事务 执行 
期 间 ， 定 期 地 把 事务 的 本 地 状态 保存 到 海量 存储 设备 里 。 

基于 上 述 原因 ， 在 恢复 时 ， 往 往 对 崩溃 时 还 处 于 活动 状态 的 事务 实施 回 退 ， 以 利于 实现 
事务 的 原子 性 。 注 意 ， 这 里 我 们 关心 的 是 崩溃 前 事务 T 给 数据 库 所 带 来 的 变动 。 事 务 还 可 能 会 
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产生 一 些 其 他 的 〈 外 部 ) 影响 。 例 如 ， 在 屏幕 上 显示 一 条 消息 ， 或 在 工厂 里 启动 一 台 控 制 器 
等 。 尽 管 我 们 在 21.3.2 节 讨论 了 处 理 它们 的 一 种 办 法 ， 但 是 外 部 行为 一 般 是 很 难 逆转 的 。 

回 退 机 制 不 仅 可 以 用 来 处 理 崩 涡 ， 还 可 以 用 来 处 理事 务 异 常 中 止 。 一 个 事务 可 能 由 于 众 
多 原因 而 异常 中 止 : 

。 事 务 可 能 因 用 户 而 异常 中 止 。 例 如 ， 用 户 输入 了 错误 的 数据 。 

。 事 务 可 能 因 本 身 而 异常 中 止 。 例 如 ， 它 在 数据 库 里 遇 到 了 某 个 意外 的 信息 。 

。 事 务 可 能 因 系 统 而 异常 中 止 。 例 如 ， 一 个 事务 可 能 会 与 其 他 事务 发 生死 锁 ， 或 者 一 个 事 

务 可 能 由 于 缺乏 足够 的 系统 资源 而 无 法 完成 ， 或 者 由 于 违反 了 约束 条 件 而 异常 中 止 。 

持久 性 要 求 事务 一 旦 提交 ， 它 对 数据 库 的 影响 就 下 会 消失 。 数 据 库 通常 储存 在 磁盘 这 样 
的 海量 存储 设备 里 。 由 于 通常 系统 崩 汕 不 会 波及 这 些 设备 ， 所 以 海量 存储 设备 通常 称 为 非 易 
KB (nonvolatile) 的 。 然 而 ， 这 些 设备 将 受到 其 固有 的 故障 形式 ， 即 介质 故障 (media 
failure) 的 影响 。 介 质 故 障 可 能 会 影响 设备 上 储存 的 全 部 或 部 分 数据 。 应 对 这 种 故障 并 保持 持 
久 性 的 一 种 方法 就 是 数据 的 元 余 存 储 。 宛 余 拷 贝 越 多 ， 可 以 容许 的 介质 故障 也 就 越 多 。 因 此 ， 
持久 性 并 非 是 绝对 的 ， 它 依赖 于 数据 的 价值 以 及 公司 在 数据 保护 方面 的 投资 规模 。 因 为 在 事 
务 执行 过 程 中 有 可 能 会 发 生 介质 故障 ， 所 以 介质 故障 的 恢复 程序 也 必须 提供 回 退 的 能 力 。 


25.2 直接 型 更 新 系统 和 先 写 型 日 志 


直接 型 更 新 系统 和 延迟 型 更 新 系统 的 回 退 机 制 是 不 一 样 的 。 因 为 直接 型 更 新 系统 
(immediate-update system) 的 应 用 比较 普遍 ， 所 以 首先 介绍 这 种 系统 。 对 这 种 系统 的 介绍 将 
分 为 几 个 阶段 。 在 本 节 中 ， 我 们 描述 一 个 简单 但 却 不 太 现 实 的 系统 ， 以 说 明 其 主要 的 思想 。 
在 以 后 各 节 我 们 再 讨论 在 商用 系统 中 必须 处 理 的 一 些 难 题 ， 以 及 为 解决 这 些 难题 必须 对 简单 
系统 所 做 的 改进 。 

直接 型 更 新 系统 维护 着 一 个 由 一 系列 记录 构成 的 日 志 (log )。 每 当 事 务 执行 时 ， 其 记录 就 
被 添加 到 日 志 里 ， 这 些 记录 从 不 修改 或 删除 。 系 统 就 是 引用 日 志 而 实现 原子 性 和 持久 性 的 。 对 
于 持久 性 而 言 ， 该 日 志 是 在 存放 数据 库 的 海量 存储 设备 发 生 故 障 后 用 来 复原 数据 库 的 。 因 此 ， 
日 志 必须 保存 在 非 易 失 型 存储 设备 里 。 一 般 情 况 下 ， 日 志 是 储存 在 磁盘 上 的 顺序 文件 。 此 外 ， 
日 志 通常 都 被 复制 (并 将 拷贝 存放 在 不 同 的 设备 上 )， 以 避免 单个 介质 故障 所 产生 的 影响 。 

存储 器 的 组 织 结构 如 图 25-1 所 示 。 从 效率 的 角度 考虑 ， 数 据 库 和 数据 库 服 务 器 之 间 数 据 
传送 的 单位 是 页 ， 最 近 访 问 的 页 面 存 放 在 易 失 型 存储 器 的 高 速 缓存 (cache) 里 。 此 外 ， 最 终 
将 存放 到 日 志 里 的 信息 通常 首先 储存 在 易 失 型 存储 器 的 日 志 缓 冲 区 (log buffer) H. WAA 
存 和 日 志 缓 冲 区 的 存在 使 得 回 退 和 提交 的 处 理 愈加 复杂 。 在 本 节 中 ， 我 们 始终 假设 高 速 缓存 
和 日 志 缓 冲 区 均 未 使 用 ， 并 且 假 设 信 息 是 直接 从 数据 库 读 取 或 写 人 数据 库 ， 并 直接 写 人 日 志 
里 的 。 

当 事 务 执行 某 个 会 改变 数据 库 状 态 的 操作 时 ， 系 统 便 在 日 志 中 添加 一 条 更 新 记录 (update 
record) 【倘若 是 纯粹 读 取 数 据 库 的 操作 ， 那 就 不 需要 添加 记录 )。 每 个 更 新 记录 都 描述 了 已 经 
做 出 的 变更 ,尤其 是 它 包 含有 足够 的 信息 ， 万 一 事务 异常 中 止 的 话 ， 系 统 可 以 撤销 所 做 的 变 
更 。 由 于 每 当做 出 变更 便 添 加 记录 ， 于 是 日 志 里 就 汇聚 了 所 有 事务 的 更 新 记录 。 

更 新 记录 以 最 简单 的 形式 记载 着 被 修改 的 数据 库 项 的 前 像 (before-image)， 即 修改 实施 
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前 该 数据 项 的 一 份 物理 拷贝 。 一 旦 事务 异常 中 止 ， 这 个 更 新 记录 就 可 用 于 把 该 项 数据 复原 成 
其 原先 的 值 。 因 此 ， 前 像 有 时 又 称 为 撤销 记录 (undo record)。 倘 若 并 发 性 控制 令 操 作 可 串 行 
化 地 执行 《 即 修改 该 项 数据 时 ， 该 数据 项 锁 住 ， 并 严格 地 进行 并 发 性 监控 )， 那 么 其 他 的 并 发 
事务 是 访问 不 到 该 新 数据 值 的 。 因 此 ， 异 常 中 止 的 事务 对 其 他 事务 没有 任何 影响 ; 一 旦 恢复 ， 
对 数据 库 也 没有 任何 影响 了 。 除 了 前 像 之 外 ， 更 新 记录 还 确认 采用 事务 ld (transaction Id) 作 
出 变更 的 事务 以 及 改变 了 的 数据 项 。 后 面 我 们 还 会 介绍 更 新 记录 中 包含 的 其 他 信息 。 


非 易 失 型 
存储 器 








图 25-1 存储 器 的 组 织 结构 
由 于 更 新 记录 中 包含 着 数据 项 的 一 份 物理 拷贝 ， 所 以 登录 的 这 种 形式 称 为 物理 型 登录 


(physical logging )。 

如 果 系 统 让 事务 T 异 常 中 此 或 事务 T 自 行 异 常 中 止 ， 那 么 使 用 日 志 完 成 回 退 是 相当 简单 
的 。 从 后 向 前 地 扫描 日 志 ， 一 旦 遇 到 T 的 更 新 记录 、 就 把 前 像 写 人 数据 库 , :以 此 来 撤销 更 改 。 
因为 日 志 可 能 特别 长 ; 所 以 反 向 地 扫描 整个 日 志 以 确保 所 有 T 的 更 新 记录 都 被 处 理 的 方法 是 
不 现实 的 。 为 了 避免 这 种 从 尾 到 头 的 扫描 ， 每 当 事 务 开始 执行 时 ， 就 向 日 志 追 加 一 条 包含 该 
事务 Id 的 开始 记录 (begin record)。 一 旦 遇 到 T 的 开始 记录 ， 从 尾 开始 的 扫描 就 可 以 结束 
(为 了 便于 访问 ， 可 以 把 某 介 事务 的 日 志 记录 链接 在 一 起 ， 并 且 把 最 近 访 问 的 记录 放 在 该 链 
表 的 头 部 )。 | 

把 这 种 技术 扩展 一 下 就 可 以 实现 存储 点 ( savepoint)。 每 当 事 务 声明 某 个 存储 点 时 ， 就 有 
一 条 存储 点 记录 (savepoint record) 写 入 日志。 这 条 记录 不 仅 包含 此 事务 的 Id 和 该 存储 点 的 Id， 
还 可 能 包含 声明 该 存储 点 时 打开 的 任何 游标 的 信息 。 为 了 回 退 到 某 个 特定 的 存储 点 ， 将 反 向 
地 扫描 日 志 ， 直 到 到 达 该 存储 点 的 记录 为 止 。 扫 描 过 程 遇 到 的 每 条 事务 更 新 记录 的 前 像 直接 
应 用 到 此 数据 库 上 。 记 录 里 的 游标 信息 则 用 来 重新 确定 声明 该 存储 点 时 的 游标 位 置 。 

崩溃 所 引起 的 回 退 要 比 单个 事务 的 异常 中 止 复杂 一 些 ， 因 为 在 恢复 的 时 候 ， 系 统 必须 首 
先 分 辨 出 哪些 事务 需要 异常 中 止 。 尤 其 是 ， 系 统 对 崩 满 发 生 时 已 完成 的 事务 (包括 已 提交 
已 异常 中 止 的 ) 和 还 在 活动 的 事务 必须 加 以 区 分 。 而 所 有 还 处 于 活动 状态 的 事务 则 必须 使 之 
异常 中 止 。 i | 

当 其 个 事务 提交 的 时 候 ， 它 就 会 把 一 条 提交 记录 (commit record) SHAH. MRI 
个 事务 异常 中 止 ， 那 么 该 事务 便 回 退 它 的 更 新 操作 ， 并 把 一 条 异常 中 止 记录 (abort record) 
号 到 日 志 里 。 这 两 种 记录 都 包含 着 该 事务 的 Id。 当 写 完 提交 记录 或 异常 中 止 记 录 之 后 ， 该 事 
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务 就 可 以 释放 其 持 有 的 任何 锁 。 

利用 这 些 记 录 ， 恢复 程序 可 以 确定 崩溃 时 还 有 哪些 事务 处 于 活动 状态 。 在 反 向 扫描 过 程 
中 ， 如 果 与 TI 有 关 的 第 一 条 记录 是 更 新 记录 ， 那 么 可 以 断定 ， 贿 定 发 生 时 T 还 处 于 活动 的 状态 ， 
因此 T 必 须 被 异常 中 止 。 如 果 第 一 个 记录 是 提交 记录 或 异常 中 止 记录 ， 那 么 就 可 以 断定 ， 崩 省 
发 生 时 T 已 经 处 于 完成 状态 ， 那 么 以 后 再 遇 到 它 的 更 新 记录 时 ， 便 可 以 忽略 。 

值得 注意 的 是 ， 出 于 持久 性 的 考虑 ， 每 当 T 提 交 时 就 向 日 志 写 人 一 条 提交 记录 是 非常 重要 
的 。 因 为 我 们 的 简化 模型 假设 ， 当 T 请 求 某 个 写 人 操作 时 ， 该 数据 库 是 直接 更 新 的 ; 所 以 当 T 
请 求 提交 时 ， 它 所 请 求 的 数据 库 更 新 全 部 都 记录 在 非 易 失 型 存储 器 里 。 然 而 ， 提 交 请 求 本 身 
却 是 无 法 保证 持久 性 的 。 倘 车 在 事务 请 求 提交 之 后 ， 但 在 其 提交 记录 写 人 日 志 之 前 就 出 现 了 
崩 福 ， 那 么 该 事务 将 被 恢复 程序 异常 中 止 ， 于 是 此 系统 也 无 法 提供 持久 性 。 因 此 ， 一 个 事务 
在 其 提交 记录 写 人 海量 存储 器 的 日 志 之 前 ， 并 不 能 算 真 正 提交 。 


向 日 志 追 加 一 条 提交 记录 是 一 种 原子 操作 〈 该 记录 要 么 在 日 志 里 ， 要 么 不 在 日 志 里 )， 

当 且 仅 当 这 一 动作 完成 后 ， 该 事务 才 算 是 真正 提交 了 。 

1. 检测 点 

关于 崩溃 我 们 还 必须 考虑 一 个 问题 ， 那 就 是 必须 采用 某 种 机 制 ， 以 避免 恢复 过 程 中 反 向 
地 扫描 整个 日 志 。 倘 车 没有 这 种 机 制 ， 恢 复 过 程 就 无 法 知道 该 何 时 停止 扫描 。 因 为 一 个 在 崩 
溃 时 刻 还 处 于 活动 状态 的 事务 ， 也 许 它 在 很 早 的 时 候 曾 向 日 志 写 和 人 过 一 条 更 新 记录 ， 可 是 其 
后 一 直到 崩溃 为 止 都 没有 做 过 任何 数据 库 更 新 操作 。 除 非 持 续 反 向 扫描 直到 到 达 该 更 新 记录 ， 
否则 恢复 过 程 不 能 发 现 该 事务 存在 的 任何 迹象 。 为 了 解决 这 种 情况 ， 系 统 需要 周期 性 地 向 日 
志 写 人 一 条 检测 点 记录 (checkpoint record) ， 以 列 出 所 有 当前 活动 事务 的 标识 。 恢 复 过 程 
(至 少 ) 必须 反 向 地 扫描 到 最 近 一 次 的 检测 点 记录 。 如 果 T 的 标识 列 在 某 个 检测 点 记录 中 ， 但 
恢复 过 程 从 该 检测 点 记录 开始 一 直到 日 志 结 束 ， 都 没有 遇 到 该 事务 的 结束 记录 ， 那 么 可 以 认 
为 当月 溃 发 生 时 ， 该 事务 还 是 活动 的 。 于 是 ， 反 向 扫描 必须 继续 进行 ， 直 到 过 到 该 事务 的 开 
始 记录 为 止 。 只 有 在 所 有 这 样 的 事务 都 处 理 完成 后 ， 反 向 扫描 才能 够 结束 。 扫 描 过 程 用 到 的 
仅仅 是 最 近 一 次 的 检测 点 记录 (每 个 检测 点 记录 将 取代 它 以 前 的 那个 检测 点 记录 )。 检 测 点 记 
录 写 入 日 志 的 频 度 将 会 影响 到 恢复 的 速度 ， 因 为 检测 频率 高 意味 着 需要 反 疝 扫描 的 日 志 少 。 

图 25-2 给 出 了 日 志 的 一 个 例子 。 在 恢复 过 程 的 反 向 扫描 中 ， 它 发 现 Te 和 T, 在 崩溃 时 还 处 于 
活动 状态 ， 因 为 它们 最 后 追加 的 记录 都 是 更 新 记录 。 恢 复 过 程 按照 反 向 扫描 时 遇 到 的 先后 顺 
序 利用 这 些 记录 里 的 前 像 ， 来 回 退 这 些 记录 所 指出 的 数据 库 项 。 由 于 首先 遇 到 的 Ts 记录 是 提 
交 记 录 ， 所 以 恢复 过 程 知 道 当 崩溃 发 生 时 Ts 处 于 非 活 动 状态 ， 因 此 可 忽略 Ts 的 更 新 记录 。 当 
过 到 检测 点 记录 时 ， 恢 复 过程 便 得 知 ， 在 设 定 该 检测 点 时 ，T!、Ts 和 Ts 是 活动 的 (Te 没有 在 检 
测 点 记录 中 提 及 ， 因 为 它 是 在 该 检测 点 设 定之 后 才 开 始 的 )。 于 是 ,恢复 过 程 可 得 出 以 下 结论 : 
当 崩 潢 发 生 时 ， 除 了 T, 和 Te 以 外 ，Ts 也 处 于 活动 状态 (因为 没 遇 到 T; 的 结束 记录 )。 再 也 没有 
其 他 事务 处 于 活动 状态 了 ， 因 此 ， 必 须 异常 中 止 的 事务 就 是 这 几 个 。 恢 复 过 程 必须 继续 其 反 
向 扫描 ， 按 照 遇 到 T!、T3 和 Te 的 更 新 记录 的 顺序 来 处 理 这 些 更 新 记录 。 只 有 遇 到 这 些 事 务 的 
开始 记录 后 ， 反 向 扫描 才能 宣告 结束 。 
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所 一 反问 扫描 





Ui: 事务 T, 的 撤销 记录 
Bi， 事 务 Ti 的 开始 记录 

Ci'， 事 务 Ti 的 提交 记录 
Ai: 事务 Ti 的 异常 中 止 记 录 
CK: 检测 点 记录 


图 25-2 日 志 的 一 个 例子 


2. 先 写 型 登录 

我 们 已 经 假设 ， 当 更 新 数据 库 项 x 的 时 候 ， 数 据 项 x* 的 更 新 记录 也 要 写 入 日 志 里 。 实 际 上 ， 
更 新 x 和 追加 其 更 新 记录 必须 遵循 一 定 的 顺序 。 如 果 操 作 顺 序 不 同 ， 又 有 什么 差别 呢 ? 我 们 不 
妨 假设 在 执行 这 些 操 作 时 发 生 了 崩溃 的 情况 。 如 果 崩 溃 发 生 在 这 两 种 操作 都 尚未 完成 之 前 ， 
那 就 没有 问题 。 日 志 里 没有 任何 更 新 记录 ，x 没 有 被 更 新 ， 因 此 也 不 需要 恢复 过 程 对 x 执行 任 
何 撤销 操作 。 如 果 崩 溃 发 生 在 这 两 种 操作 之 后 ， 恢 复 过 程 也 会 像 上 面 所 说 那样 正确 地 处 理 。 
可 是 ,倘若 首先 更 新 的 是 xz， 随后 却 发 生 了 崩溃 ， 而 其 更 新 记录 还 没 来 得 及 追加 到 日 志 里 ; 那 
么 由 于 日 志 里 没有 其 前 像 ， 恢 复 过 程 无 法 引用 ， 所 以 就 不 能 对 该 事务 进行 回 退 .。 因 此， 恢复 
无 法 把 数据 库 回归 到 某 个 一 致 状态 一 一 这 是 一 种 不 可 接受 的 状况 。 

另 一 方面 ， 如 果 首 先 把 更 新 记录 追加 到 日 PAREN T: SR E emma 
志 里 ， 那 么 问题 就 解决 了 。 当 重新 启动 时 ， 恢 录 附 加 到 日 志 里 值 更 新 为 5 
复 过 程 只 需要 引用 该 更 新 记录 对 x 进行 复原 就 ”- 
可 以 了 。 如 图 25-3 所 示 ， 无 论 崩 溃 是 发 生 在 该 
事务 将 x 的 新 值 写 入 数据 库 之 前 还 是 之 后 ， 两 
者 的 结果 都 是 一 样 的 。x 的 初 值 是 3， 事 务 把 它 
改 成 5， 在 事务 提交 之 前 系统 崩溃 了 。 如 果 崩 





省 在 更 新 记录 写 人 日 志 之 后 ， 但 又 在 x 值 更 新 之 tasi inthe 
前 《图 中 崩溃 1 处 ) 发 生 ， 那 么 当 系统 重新 启 。 ”图 25-3 利用 先 写 型 日 志 ， 恢 复 程序 可 以 
动 时 ， 数 据 库 中 x 的 值 和 其 更 新 记录 中 的 x 前 像 正确 地 处 理 数据 库 的 恢复 


里 的 值 是 一 样 的 。 恢 复 过 程 按 照 前 像 来 重 写 x-， 并 没有 改变 x 的 值 ， 但 完成 恢复 后 的 x 最 终 状 态 
是 正确 的 。 如 果 崩 溃 发 生 在 更 新 x 的 值 之 后 (图 中 崩溃 2 处 );) 恢复 过 程 也 会 把 x 的 值 复原 为 3。 

因此 ， 始 终 必须 在 更 新 数据 库 之 前 首先 把 更 新 记录 追加 到 日 志 里 。 这 一 特性 称 为 先 写 
(write-ahead) 特性 ， 这 种 日 志 也 就 称 为 先 写 型 日 志 (write-ahead log). 


25.2.1 性 能 和 先 写 型 登录 
尽管 上 一 节 介 绍 的 先 写 型 登录 方法 工作 正确 ， 然 而 从 性 能 的 观点 来 看 ， 这 种 方法 是 不 能 


\ 
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接受 的 ， 因 为 它 使 更 新 数据 库 的 MO 操作 的 数量 增加 了 一 倍 。 每 次 数据 库 更 新 都 需要 向 日 志 追 
加 一 条 记录 。 为 避免 这 一 开销 ， 数 据 库 系统 经 常 利用 易 失 型 存储 器 中 的 日 志 缓冲 区 ， 作 为 日 
志 记录 的 临时 存储 器 。 该 日 志 缓 冲 区 可 以 看 成 是 海量 存储 器 中 日 志 的 一 种 扩展 。 如 图 25-1 所 
示 ， 日 志 记录 首先 被 追加 到 缓冲 区 ， 一 旦 日 志 缓冲 区 填 满 ， 再 将 它们 追加 到 或 刷 入 (flushed) 
日 志 里 。 使 用 日 志 缓 冲 区 以 后 ， 写 日 志 的 代价 就 由 缓冲 区 中 的 所 有 日 志 记录 来 分 摊 。 

从 崩溃 恢复 的 观点 来 看 ， 储 存在 易 失 型 存储 器 上 的 日 志 缓 冲 区 与 储存 在 海量 存储 器 上 的 
日 志 有 着 很 大 的 区 别 。 当 系统 月 涡 时 ， 日 志 缓 冲 区 中 的 内 容 将 会 丢失 。 

此 外 ， 我 们 的 介绍 忽略 了 一 个 事实 ， 那 就 是 为 了 提高 性 能 ， 绝 大 多 数 的 数据 库 系 统 都 支 
持 将 最 近 访 问 的 数据 库 页 面 储存 在 易 失 型 存储 器 的 高 速 缓存 里 。 这 样 ， 当 一 个 事务 访问 某 个 
数据 库 中 的 数据 项 x 的 时 候 ， 该 数据 库 系 统 首 先 将 把 包含 x 的 海量 存储 器 中 的 数据 库 页 面 带 到 
高 速 缓 在 中， 然后 把 zx 的 值 拷贝 到 该 事务 的 缓冲 区 中 。 将 该 页 面 存放 在 高 速 缓 存 里 是 基于 这 样 
的 假设 : 此 事务 很 可 能 不 久 就 会 更 新 * 的 值 ， 或 者 读 取 该 页 里 的 其 他 数据 项 。 若 是 这 样 ， 就 可 
避免 一 次 页 面 传送 ， 因 为 可 以 直接 访问 高 速 缓存 里 的 页 面 (无 须 1/O 操 作 )。 例 如 ， 一 个 事务 可 
以 通过 游标 来 扫描 某 张 表 。 当 从 某 页 里 检索 了 一 行 数 据 之 后 ， 事务 将 要 获取 的 下 一 行 很 可 能 
就 在 同一 页 里 。 

如 果 更 新 了 x， 高 速 缓存 里 该 页 的 拷贝 (并 非 数据 库 中 该 页 的 原始 拷贝 ) 将 被 修改 。 在 高 
” 速 缓存 里 该 页 将 标记 为 脏 (dirty )， 意 思 是 它 所 包含 的 数据 库 记 录 版 本 要 比 海量 存储 器 中 的 版 
本 新 。 当 高 速 缓冲 空间 不 足 时 ， 对 于 标记 为 干净 (clean, JEE) 的 高 速 缓存 页 面 ， 即 仅仅 读 
取 其 内 容 的 那些 页 面 ， 可 以 用 数据 库 的 新 页 面 直接 覆盖 。 然 而 ， 脏 页 面 在 其 能 够 被 覆盖 之 前 ， 
首先 必须 回 写 到 数据 库 里 。 至 于 哪些 页 面 应 该 保留 在 高 速 缓 存 里 的 决策 ， 是 由 某 种 页 面 置换 
算法 来 确定 的 。 该 算法 的 目标 是 使 由 高 速 缓存 页 面 满足 的 数据 库 访问 的 数目 尽 可 能 地 多 ， 同 
时 又 保持 数据 库 的 一 致 性 。 例 如 ， 最 近 最 少 使 用 (Least-Recently-Used, LRU) 算法 可 以 用 于 
在 高 速 缓存 里 保持 最 近 经 常 使 用 的 页 面 。 

日 志 缓冲 区 和 高 速 缓存 的 使 用 使 先 写 型 登录 愈加 复杂 ， 因 为 它们 影响 到 海量 存储 器 中 数 
据 库 和 日 志 的 实际 更 新 时 间 。 前 面 介 绍 的 简单 方案 的 两 条 性 质 必 须 保持 : 先 写 性 和 提交 的 持 
久 性 。 

只 要 能 够 确保 在 高 速 缓存 的 脏 页 面 回 写 到 数据 库 之 前 ， 首 先 把 日 志 缓冲 区 里 对 应 的 更 新 . 
记录 写 人 日 志 ， 先 写 性 就 可 以 得 到 保持 。 为 达到 这 一 目的 ， 一 般 采 用 两 种 机 制 。 先 看 第 一 种 
机 制 。 数 据 库 一 般 支 持 两 种 操作 来 把 一 条 记录 追加 到 日 志 里 。 一 种 操作 只 是 单纯 地 把 该 记录 
添加 到 日 志 缓冲 区 里 ， 而 另 一 种 操作 则 是 先 把 该 记录 追加 到 缓冲 区 里 ， 接 着 立即 把 缓冲 区 里 
的 内 容 写 人 日 志 。 后 一 种 操作 称 为 强制 性 (forced) 操作 。 一 个 正常 ( 非 强制 性 ) 的 写 入 操作 
只 不 过 是 登记 一 个 请 求 ， 请 求 操作 系统 向 海量 存储 器 写 人 某 个 页 面 (该 IO 操作 要 在 以 后 的 某 
个 时 间 里 完成 )， 而 强制 性 写 人 操作 在 该 写 人 未 完成 以 前 是 不 会 把 控制 权 返 还 给 其 调用 者 的 。 
由 于 日 志 是 串 行 排列 的 ， 因 此 每 当 一 个 例 程 请 求 对 某 条 更 新 记录 进行 强制 性 写 和 操作 时 ， 就 
需要 把 其 前 的 所 有 记录 也 都 全 部 写 人 日 志 。 一 旦 该 例 程 恢 复 执行 ， 就 可 以 确保 这 些 记录 已 被 
储存 到 海量 存储 器 里 了 。 这 样 就 可 以 安全 地 提出 请 求 ， 把 相应 的 高 速 缓存 脏 页 面 写 和 数据 库 。 

第 二 种 机 制 采用 日 志 序 列 号 (Log Sequence Number，LSN) 对 所 有 的 日 志 记录 顺序 地 编 
号 ,该 序列 号 是 存储 在 其 日 志 记录 里 的 。 此 外 ， 对 于 每 个 数据 库 页 面 ， 其 中 还 存储 着 对 该 页 
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最 近 一 次 更 新 的 更 新 记录 的 LSN。 这 样 ， 如 果 某 个 数据 库 页 面包 含 数据 项 x、y、z， 而 且 最 近 
一 次 的 更 新 项 是 y， 那 么 该 页 存放 的 LSN 的 值 将 是 y 的 最 近 更 新 记录 的 LSN.。 

利用 强制 性 写 入 和 LSN 机 制 ， 我 们 可 以 保证 先 写 性 。 当 需要 高 速 缓存 的 空间 ， 并 且 决 定 
把 脏 页 面 P 的 内 容 回 写 到 海量 存储 器 里 时 ， 系 统 需 要 确定 日 志 缓冲 区 是 否 继续 保存 其 LSN 值 等 
于 储存 在 P 中 的 LSN 值 的 那些 更 新 记录 ? 若是 ， 那 么 P 中 的 这 个 LSN 值 必然 要 比 海量 存储 器 里 
日 志 的 最 后 一 条 记录 的 LSN 值 大 。 因 此 ， 日 志 缓冲 区 的 内 容 必 须 在 该 页 写 人 数据 库 之 前 强制 
性 地 写 人 海量 存储 器 。 若 不 是 ， 那 么 与 该 页 的 某 个 数据 项 的 最 近 一 次 更 新 相对 应 的 更 新 记录 
已 经 追加 到 海量 存储 器 的 日 志 里 了 ， 于是， 立即 可 以 覆盖 高 速 缓存 中 的 该 页 面 。 

这 样 ， 我 们 看 到 ， 为 了 实现 先 写 性 ， 有 时 候 我 们 必须 推迟 包含 某 个 更 新 项 的 高 速 缓存 页 
面 的 写 人 操作， 直到 包含 该 相应 项 更 新 记录 的 日 志 缓冲 区 已 经 写 人 日 志 为 止 。 为 了 实现 持久 
性 ， 我 们 必须 确保 在 T 的 提交 记录 追加 到 海量 存储 器 的 日 志 里 以 前 ，T 所 更 新 的 所 有 数据 项 的 
新 值 都 已 经 储存 在 海量 存储 器 里 。 否 则 ， 如 果 崩 溃 出 现时 该 提交 记录 已 经 追加 了 ， 可 是 其 新 
数据 值 尚 未 来 得 及 存放 到 海量 存储 器 时 的话， 那么 该 事务 虽然 已 经 提交 ， 但 是 其 新 数据 值 将 
丢失 。 因 此 ， 尽 管 系统 的 崩溃 得 到 了 处 理 ， 可 是 持久 性 却 设 能 实现 。 

有 两 种 策略 可 以 确保 持久 性 : 强制 (force) 策略 和 非 强制 (no-force) 策略 。 采 用 强制 策 
略 是 把 页 面 写 人 高 速 缓存 扩展 为 强制 操作 。 在 IT 的 提交 记录 追加 到 海量 存储 器 日 志 之 前 ， 高 速 
缓存 中 被 T 更 新 过 的 数据 库 页 面 都 被 强制 性 地 移 到 数据 库 中 。 其 事件 序列 如 下 : 

1) 如 果 该 事务 的 最 后 一 条 更 新 记录 仍然 存放 在 日 志 缓冲 区 中 ， 那 么 强制 性 地 将 其 写 入 海 
量 存储 器 日 志 中 。 这 能 确保 所 有 的 前 像 都 是 持久 的 。 

2) 如 果 由 该 事务 的 更 新 所 产生 的 任何 脏 页 面 仍然 存放 在 高 速 缓存 中 ， 那 么 强制 性 地 将 它 
们 写 入 其 数据 库 里 。 这 能 确保 所 有 的 新 数据 值 都 是 持久 的 。 

3) 向 日 志 缓 冲 区 追加 该 提交 记录 。 一 旦 该 记录 写 入 海量 存储 器 日 志 中 ( 见 下 文 )， 就 能 确 
保 该 事务 是 持久 的 。 

图 25-4 说 明了 更 新 某 个 数据 项 x 的 事务 T 的 事件 序列 。 包 含 LSN 值 /和 前 像 zu 的 更 新 记录 位 
于 日 志 缓冲 区 里 ， 而 包含 新 值 xz 和 更 新 记录 LSN 的 更 新 页 位 于 高 速 缓 在 里 。 访 页 是 脏 的 ， 它 
MRA SARE ie. RRMA (AA thx MLSNIAs(s</)) 还 在 海量 存储 器 里 。 为 
了 满足 先 写 性 ， 必 须 在 覆盖 该 脏 页 面 之 前 (图 中 的 步骤 2)， 将 此 更 新 记录 先行 移入 海量 存储 器 
里 (图 中 的 步骤 1)。 为 了 确保 这 一 点 ， 可 能 必须 对 日 志 缓冲 区 实施 强制 写 人 。 类 似 地 ， 在 包含 
LSN 值 Kk>)) 的 提交 记录 能 够 追加 到 日 志 缓 冲 区 之 前 ， 庶 脏 页 面 的 内 容 必须 先行 写 和 海量 存储 
器 ， 以 便 确保 它 在 提交 记录 (图 中 的 步骤 3) 之 前 就 已 经 在 海量 存储 器 里 了 。 为 确保 这 一 点 ， 强 
制 写 入 脏 页 面 是 有 必要 的 。 

值得 注意 的 是 ， 对 提交 记录 采取 强制 写 人 并 非 是 必需 的 。 然而 ， 在 提交 记录 尚未 写 人 海 
ris 在 有 些 系统 里 ， 每 当 提交 记录 追加 到 缓冲 区 

志 缓 冲 区 的 内 容 就 被 强制 写 人 海量 存储 器 ， 于 是 提交 立即 生效 。 然 而 ， 另 外 一 些 系统 
WEARS AHEM MC, KNEET ASA HEDRE 不过， 计生 交 提 让 只 有 有 等 
到 以 后 在 将 其 日 志 缓 冲 区 移 往 海量 存储 器 时 才能 奏效 。 这 种 协议 称 为 成 组 提交 (group 
commit) ， 因 为 这 一 组 事务 的 提交 记录 全 都 在 日 志 缓冲 区 里 ， 一 旦 出 现 了 下 一 次 的 写 人 ， 它 们 
就 一 次 全 部 提交 。 
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非 易 失 型 
存储 器 





T 的 提交 记录 

图 25-4 采用 强制 策略 实现 持久 性 。 在 该 事务 的 提交 记录 写 和 日 志 之 前 ， 可 能 必须 强制 把 事务 修 
改过 的 页 面 从 高 速 缓存 写 人 数据 库 。 在 事务 T 更 新 过 的 包含 LSN 值 /的 脏 页 面 能 够 号 人 数 
据 库 之 前 ， 可 能 必须 强制 日 志 缓冲 区 将 LSN 值 等 于 /的 更 新 记录 移 往 海量 存储 器 日 志 (])。 
在 此 脏 页 面 被 覆盖 (2) 之 后 ，T 的 提交 记录 就 可 以 追加 到 日 志 缓 冲 区 里 了 (3)。 其 日 志 缓 冲 
区 的 内 容 则 可 以 在 以 后 的 某 个 时 间 再 写 人 日 志 


采用 强制 策略 确保 持久 性 的 主要 缺点 是 : 覆盖 高 速 缓存 脏 页 面 与 提交 这 两 个 操作 是 同步 
的 。 被 某 个 事务 修改 过 的 页 面 必 须 在 该 事务 提交 之 前 写 到 数据 库 里 。 由 于 页 面 的 写 人 操作 比 
较 缓 慢 ， 因 此 事务 的 提交 就 被 推 尽 了 ， 从 而 影响 了 响应 时 间 。 

强制 策略 的 另 一 个 缺点 是 要 与 被 不 同事 务 频繁 修改 的 页 面 打交道 (例如 ， 那 些 含有 系统 
相关 信息 的 页 面 )。LRU 页 面 置换 算法 可 能 不 会 选择 把 这 样 的 页 面 换 出 高 速 缓存 ;然而 ， 由 于 
强制 策略 ， 每 当 包含 着 对 此 页 面 进行 修改 的 某 个 事务 提交 时 ， 该 页 面 都 要 被 重 写 。 另 -方面 ， 
强制 策略 的 优点 在 于 : 崩溃 发 生 后 ， 恢 复 已 经 提交 的 事务 时 根本 无 需 采取 任何 动作 。 届 时 ， 
该 事务 的 提交 记录 已 经 写 入 海量 存储 器 日 志 里 ， 同 时 所 有 由 该 事务 更 新 而 产生 的 新 值 也 已 经 
拷贝 到 海量 存储 器 数据 库 里 。 下 一 节 中 讨论 的 非 强制 策略 未 必 能 保证 这 样 的 结果 。 


25.2.2 检测 点 和 恢复 


在 上 一 节 ， 我 们 指出 ， 事 务 T 所 更 新 的 某 个 数据 项 * 的 新 值 ， 在 该 事务 请 求 提交 时 ， 仍然 
可 以 留 在 高 速 缓冲 区 的 某 个 脏 页 面 里 (这 意味 着 该 数据 库 页 面 的 拷贝 还 没有 被 更 新 )。 为 了 保 
持 T 的 持久 性 ， 系 统 必须 在 IT 的 提交 记录 写 入 海量 存储 器 日 志 之 前 ， 先 把 x 的 新 值 记 录 到 海量 存 
储 器 里 。 确 保 该 值 在 非 易 失 型 存储 器 里 的 常用 办 法 是 ， 除 了 前 像 外 ,把 后 像 也 储存 在 该 日 志 
的 更 新 记录 里 。 

简单 地 说 ， 更 新 的 数据 项 的 后 像 (after-image ) (有 时 称 为 重 做 记录 (redo record) ) 就 是 
该 数据 项 新 值 的 一 份 物理 型 拷贝 。 因 为 在 日 志 中 ，T 的 所 有 更 新 记录 都 先 于 其 提交 记录 ， 所 以 
每 当 T 的 提交 记录 写 人 海量 存储 器 日 志 时 ， 海 量 存储 器 里 已 经 储存 着 T 所 创建 的 所 有 数据 库 项 
的 新 值 了 。 这 样 ， 即使 海量 存储 器 中 包含 x 的 数据 库 页 面 在 事务 T 提 交 时 尚未 更 新 ， 而 在 T 提 交 
后 系统 崩 注 ， 那 么 正如 图 25-5 所 示 ， 恢 复 时 可 以 通过 后 像 在 数据 库 页 中 安装 x 的 新 值 。 先 写 性 
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依然 要 求 在 脏 页 面 剧 入 数据 库 之 前 ， 先 将 更 新 记录 写 和 海量 存储 器 日 志 。 但 是 ， 对 于 提交 记 
录 写 人 的 时 间 ， 不 再 有 任何 的 顺序 规定 。 特 别 地 ， 提 交 记 录 也 可 以 在 T 修 改过 的 所 有 高 速 缓存 
页 面 写 入 数据 库 之 前 ， 先 行 写 入 持久 性 存储 器 日 志 。 


非 易 失 型 
存储 器 





T 的 更 新 记录 T 的 提交 记录 
图 25-5 利用 带 有 非 强制 策略 的 后 像 实现 持久 性 。 先 写 性 要 求 在 事务 T 所 更 新 的 脏 页 面 可 写 人 数 
据 库 之 前 (2)， 对 应 的 更 新 记录 必须 已 经 写 人 海量 存储 器 日 志 (1)。 虽 然 该 提交 记录 不 能 在 
更 新 记录 之 前 写 人 日 志 ， 但 是 提交 记录 的 写 人 时 间 和 脏 页 面 的 写 人 时 间 之 间 的 关系 是 不 
受制 约 的 


非 强制 策略 的 显著 优点 是 : 事务 T 马 上 可 以 提交 ， 无 须 等 到 高 速 缓存 中 更 新 过 的 所 有 页 面 
都 得 到 强制 为 止 。 其 缺点 在 于 ,一旦 发 生 崩 溃 ， 恢 复 过 程 将 由 于 以 下 的 情况 而 变 得 复杂 : 

“数据 库 中 的 某 些 页 面 可 能 包含 由 尚未 提交 的 事务 所 写 人 的 更 新 。 这 些 页 面 必须 通过 日 志 

中 的 前 像 来 回 退 。 无 论 使 用 强制 策略 还 是 非 强制 策略 ， 这 个 问题 都 是 存在 的 。 
“数据 库 中 的 某 些 页 面 可 能 尚未 包含 所 有 的 由 已 提交 事务 所 写 人 的 更 新 。 这 些 页 面 必须 通 
过 日 志 中 的 后 像 来 前 滚 。 仅 当 使 用 非 强制 策略 时 ， 才 会 发 生 这 个 问题 。 

我 们 已 经 处 理 了 回 退 问题 。 现 在 的 问题 是 ， 如 何 识别 出 数据 库 中 必须 前 滚 的 页 面 ? 

一 种 办 法 是 使 用 精确 检测 点 (sharp checkpoint)。 在 把 检测 点 记录 CK 写 入 日 志 缓 冲 区 之 
前 ， 处 理 过 程 将 中 断 ， 并 把 高 速 缓存 中 的 所 有 脏 页 面 写 入 数据 库 。 因 此， 当 恢 复 过 程 扫 描 到 
CK 时 ， 可 以 断定 日 志 里 CK 前 的 所 有 更 新 记录 在 崩溃 之 前 就 已 写 入 了 数据 库 。 如 果 CK 是 最 近 
的 检测 点 记录 ， 那 么 在 日 志 里 ， 只 有 CK 以 后 的 那些 更 新 记录 才 有 可 能 尚未 写 和 数据库。 基于 
上 述 推断 ， 恢 复 处 理 可 以 分 为 三 遍 : 

“第 1 遍 ” 反 向 扫描 日 志 直 到 遇 到 最 近 的 检测 点 ， 由 此 确定 哪些 事务 在 崩溃 发 生 时 刻 还 处 

于 活动 状态 (因而 必须 被 回 退 ) 。 

“第 2 遍 ”从 该 检测 点 开始 正 向 扫描 (重演 )。 利 用 所 有 遇 到 的 更 新 记录 (无 论 其 事务 已 提 

交还 是 尚未 提交 ) 的 后 像 来 更 新 数据 库 中 对 应 的 数据 项 。 本 遍 结 束 时 ， 凡 是 由 已 提交 或 

未 提交 事务 所 引起 的 变化 都 已 到 位 ， 因 此 ， 数 据 库 的 状态 就 是 崩溃 发 生前 那 一 刻 的 状态 。 

“第 3 遍 ” 反 向 扫描 日 志 ， 以 回 退 崩溃 时 还 处 于 活动 状态 的 所 有 事务 。 利 用 这 些 事 务 的 更 
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新 记录 的 前 像 来 逆转 数据 库 里 相应 的 更 新 。 当 到 达 所 有 事务 的 开始 记录 了 时， 本 遍 就 宣告 
结束 。 其 效果 就 等 同 于 异常 中 止 所 有 未 提交 的 事务 。 
DO-UNDO-REDO (做 -撤销 - 重 做 ) 就 是 这 种 恢复 处 理 的 一 般 形式 的 名 字 。DO 是 指 事务 在 更 
新 数据 项 时 所 做 的 原始 动作 ，UNDO 是 指 倘 车 事务 没有 提交 ， 在 第 3 遍 中 出 现 的 回 退 ，REDO 
是 指 第 2 遍 中 出 现 的 前 深 。 
采用 这 一 技术 ， 需 要 考虑 三 个 问题 : 
。 在 该 检测 点 之 后 更 新 数据 项 且 又 异常 中 止 的 事务 将 提出 一 个 特殊 的 问题 。 在 它们 的 异常 
中 止 记录 追加 到 日 志 之 前 ， 这 些 更 新 已 经 被 回 退 。 遗 憾 的 是 ， 在 第 2 遍 里 ， 这 些 更 新 又 
被 恢复 到 数据 库 里 了 。 为 确保 恢复 过 程 能 够 正确 地 处 理 异常 中 止 ， 回 退 操 作 应 该 被 看 作 
该 事务 所 实施 的 普通 数据 库 更 新 。 如 图 25-6 所 示 ， 更 新 数据 项 x 的 异常 中 止 事务 在 其 日 
志 中 将 有 该 数据 项 的 两 条 记录 : . 
。 一 条 是 与 异常 中 止 前 事务 执行 的 更 新 有 关 的 更 新 记录 ， 包 含 其 前 像 zua 和 后 像 mew。 
* 另 一 条 是 与 异常 中 止 处 理 中 逆转 此 更 新 相关 的 补偿 日 志 记 录 (compensation log 
record), Q&A Rew AVE Bde 
该 补偿 日 志 记录 在 日 志 里 紧 接 在 更 新 记录 后 面 ， 而 该 事务 的 异常 中 止 记 录 则 紧 接 在 
最 后 一 条 补偿 日 志 记录 之 后 。 第 2 遍 扫描 首先 处 理 更 新 记录 ， 并 把 它 的 后 像 写 人 数据 
库 ; 然后 处 理 补偿 日 志 记 录 ， 并 把 它 的 前 像 写 信 数据库。 数据 库 中 x 的 最 终 值 为 xs。 由 
于 凯 溃 时 该 事务 未 处 于 活动 状态 ， 于 是 第 3 遍 扫 描 可 以 忽略 它 的 更 新 记录 和 补偿 日 志 记 
录 。 因 为 补偿 日 志 记录 也 可 以 看 成 是 更 新 记录 ， 所 以 它们 有 一 个 良好 的 性 质 : 将 日 志 中 
事务 的 提交 和 异常 中 止 同等 看 待 。 
* 在 最 后 的 检测 点 记录 写 人 后 ， 更 新 的 高 速 缓存 中 的 某 些 页 面 可 能 已 经 写 人 数据 库 里 。 因 
此 ， 第 2 遍 中 所 遇 到 的 一 些 更 新 记录 描述 了 已 经 被 传递 给 数据 库 的 那些 更 新 。 使 用 这 些 
记录 中 的 后 像 来 更 新 数据 库 是 不 必要 的 ， 但 并 非 不 正确 的 。 对 于 这 种 情况 ,数据库 中 数 
据 项 的 值 和 该 更 新 记录 中 的 后 像 是 等 同 的 ， 所 以 使 用 后 像 毫 无 意义 e。 
。 在 恢复 过 程 中 ， 系 统 有 可 能 再 次 崩溃 ， 在 这 种 情况 下 ， 恢 复 过 程 可 以 重新 启动 。 根 据 第 
二 次 崩溃 发 生 时 恢复 过 程 进行 到 哪 一 遍 ， 可 以 决定 第 二 次 应 用 到 该 数据 库 项 上 的 究竟 是 
前 像 还 是 后 像 。 然 而 ， 这 些 喘 像 的 使 用 是 震 等 的 (idempotent) 。 也 就 是 说 ， 采 用 一 个 特 
定 的 后 像 来 多 次 更 新 某 数 据 库 项 ， 与 更 新 一 次 有 着 相同 的 效果 。。 因 此 ， 恢 复 过程 中 的 
一 次 崩溃 (实际 上 可 能 多 次 崩溃 ) 对 结果 并 不 产生 影响 。 当 恢复 最 终 完成 时 ， 未 提交 的 
事务 已 经 异常 中 止 ， 而 已 提交 事务 所 作 的 更 新 则 已 经 写 人 了 数据 库 。 
1. 模糊 检测 点 
使 用 精确 检测 点 有 一 个 很 大 的 缺点 。 在 把 检测 点 记录 写 入 日 志 缓 冲 区 之 前 ， 系 统 必 须 中 
断 ， 并 把 脏 页 面 从 高 速 缓存 写 人 海量 存储 器 。 而 这 种 服务 的 中 断 是 许多 应 用 程序 所 不 能 接受 


O 需要 注意 的 是 ， 在 该 检测 点 记录 写 人 日 志 之 后 ,数据库 中 同一 个 数据 项 被 多 次 更 新 的 情况 。 对 于 这 种 情况 ， 
其 后 像 与 该 数据 项 的 值 是 不 相同 的 。 然 而 ， 在 第 2 遍 里 处 理 了 最 近 更 新 记录 之 后 ， 该 数据 项 的 值 便 又 恢复 
RAAT AT ASE o 
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等 性 确保 了 恢复 过 程 中 的 更 新 不 会 产生 影响 。 
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的 。 利 用 模糊 检测 点 (fuzzy checkpoint)， 只 需 对 恢复 过 程 作 少许 改动 ， 就 能 解决 这 一 问题 。 
当 一 个 检测 点 记录 写 入 日 志 时 ， 并 没有 把 脏 页 面 从 高 速 缓存 移出 ; 取而代之 的 等 价 操作 是 ， 
只 在 易 失 型 存储 器 中 对 这 些 页 面 做 个 标记 ， 随 后 在 正常 的 处 理 中 由 后 台 处 理 将 它们 写 和 人 数据 
库 。 这 种 方法 唯一 的 限制 是 : 在 前 一 个 检测 点 记录 里 所 标记 的 脏 页 面 全 部 写 入 数据 库 之 前 ， 
不 能 设置 下 一 个 检测 点 。 





图 例 : 
Ui: 事务 T, 的 更 新 记录 
Ai: 事务 Ti 的 异常 中 止 记录 
CLi: 事务 Ti 的 补偿 日 志 记 录 
CK: 检测 点 记录 
图 25-6 显示 更 新 数据 库 变量 x 的 某 个 异常 中 止 事务 的 记录 的 日 志 。 该 日 志 同 时 
包含 了 x 的 一 条 更 新 记录 和 一 条 补偿 日 志 记 录 


图 25-7 解 释 了 模糊 检测 点 。 当 CK2 追 加 到 日 志 缓冲 区 时 ， 厌 先 追 加 CK1 时 高 速 缓存 中 的 所 
有 脏 页 面 都 已 经 写 入 数据 库 。 这 些 页 面 的 修改 对 应 着 更 新 该 日 志 里 出 现在 CK1 之 前 的 记录 。 
与 该 日 志 LI 区 域 的 某 条 更 新 记录 所 对 应 的 数据 库 更 新 ， 产 生出 脏 页 面 P，P 很 可 能 在 追加 CK2 
到 日 志 缓冲 区 时 仍然 还 在 高 速 缓 存 里 (届时 P 也 许 已 经 号 大 海量 存储 器 ， 但 我 们 不 能 肯定 ) 。 
如 果 当 追加 CK2 到 日 志 缓 冲 区 时 ; P 仍 然 在 高 速 缓存 中 ， 那么 它 的 标识 将 被 打上 标记 。 直 到 下 
一 个 检测 点 记录 雹 加 之 前 ， 我 们 并 不 能 保证 该 页 已 经 写 和 数据 痒 。 由 于 图 中 崩 涡 发 生 在 该 页 
写 人 数据 库 之 前 ， 因 此 我 们 必须 做 最 坏 的 打算 : L1 和 L2 区 域 的 更 新 记录 在 狠 据 亩 里 没有 反映 
出 来 。 





图 例 : 
CK: 检测 点 记录 


图 25-7 模糊 检测 点 的 使 用 


为 了 使 数据 库 恢复 到 崩溃 前 的 所 有 更 新 已 处 理 完毕 的 状态 ,恢复 过 程 的 第 2 遍 必 须 作 如 下 
修改 ,使 前 向 扫描 从 CK1 开 始 而 不 是 从 CK2 开 始 。 第 1 遍 依 旧 在 CK2 处 结束 ， 因 为 其 目的 只 是 
确定 出 直到 崩溃 时 还 处 于 活动 状态 的 事务 。 于 是 ， 恢 复 过 程 比 使 用 精确 检测 点 时 要 慢 多 了 。 
现在 必须 权衡 恢复 速度 和 常规 操作 的 可 用 性 ， 以 决定 对 于 特定 场合 到 底 是 使 用 精确 检测 点 更 
合适 还 是 使 用 模糊 检测 点 更 合适 。 
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2. 日 志 的 存档 

. 我 们 必须 考虑 另外 一 个 问题 ， 以 使 我 们 对 日 志 登 录 和 恢复 的 讨论 (较为 ) 完 整 。 我 们 说 过 ， 
日 志 记录 追加 到 日 志 后 就 从 不 删除 。 一 旦 海量 存储 器 装 满 了 日 志 记录 以 后 ， 又 会 发 生 什么 事 
情 呢 ?你 可 能 猜想 ， 可 以 抛弃 该 日 志 的 开始 部 分 ; 然而 ， 出 于 众多 的 原因 ， 日 志 记 录 经 常 需 
要 保存 相当 长 的 一 段 时 间 。 

一 方面 ,日 志 所 包含 的 信息 不 仅仅 有 助 于 恢复 ， 还 在 其 他 方面 有 用 。 例如、 日 志保 存 了 
使 得 每 个 数据 项 变 为 其 当前 状态 的 更 新 序列 ， 当 需要 该 公司 解释 某 个 数据 项 状态 时 ， 这 些 信 
息 就 非常 有 用 。 该 日 志 还 可 以 用 来 分 析 系 统 的 性 能 。 例 如 ， 倘 车 每 条 记录 包含 一 个 时 间 惟 ， 
那么 每 个 事务 的 响应 时 间 就 可 以 计算 出 来 。 不 抛弃 日 志 的 另 一 个 原因 则 与 介质 故障 有 关 ， 这 
一 点 我 们 将 在 25.4 节 里 讨论 。 

既然 不 能 抛弃 日 志 ， 那 么 它 的 开始 部 分 就 应 该 移送 到 第 三 类 存储 器 (例如 磁带 ) 里 。 这 
一 过 程 称 为 存档 (archiving)。 只 有 最 近 的 日 志 记 录 需 要 保留 在 线 ， 于 是 现在 的 问题 是 确定 从 

该 日 志 哪 一 点 开始 移 去 一 部 分 。 当 然 ;活动 事务 的 记录 必须 保留 在 线 ， 以 便 迅 速 处 理 异常 中 
止 和 恢复 过 程 。 于 是 ， 包 含 其 LSN 值 比 最 早 活动 事务 的 开始 记录 的 LSN 值 小 的 记录 的 日 志 部 
分 可 以 存档 。 然 而 ， 介 质 故 障 恢复 还 需要 引入 其 他 的 约束 ， 这 一 点 我 们 将 在 25.4 节 里 讨论 。 


25.2.3 逻辑 型 登录 和 物理 逻辑 型 登录 # 


物理 型 登录 有 着 重大 的 缺陷 ， 在 关系 型 数据 库 场合 尤为 突出 。 一 次 简单 的 更 新 可 能 导致 
数据 库 中 大 量 页 面 的 修改 。 对 于 这 种 情况 ， 前 像 和 后 像 可 能 会 很 大 ， 并 且 难 以 管理 。 例 如 ， 
在 某 表 中 插入 一 个 元 组 可 能 需要 重新 组 织 其 所 追加 的 页 面 ， 并 在 与 该 关系 有 关 的 索引 中 插入 
新 的 索引 项 。 受 影响 的 整个 区 域 都 必须 记录 在 其 前 像 和 后 像 中 ， 这 样 使 更 新 记录 变 得 很 大 ， 
并 且 增 加 了 管理 日 志 所 必需 的 IO 开销 。 逻 辑 型 登录 就 是 弥补 这 一 缺陷 的 一 种 技术 。 

采用 逻辑 型 登录 (logical logging) 时 ， 更 新 记录 里 储存 的 不 是 需要 更 新 的 数据 项 的 快照 ， 
而 是 更 新 操作 本 身 及 其 逆 操 作 。 这 样 一 来 ， 把 行 r 插 入 表 T 的 操作 的 撤销 记录 是 <delete，r，T>， 
重 做 记录 是 <insert，r，T>。 现 在 回 退 和 前 滚 操 作 通 过 实施 适当 的 操作 构成 ， 不 再 像 物 理 型 登录 
那样 简单 地 覆盖 受 影响 的 区 域 。 使 用 这 种 方式 ， 逻 辑 型 登录 能 够 法 在 地 减少 日 志 维 护 的 开销 。 

然而 ， A 逻辑 型 操作 未 必 是 智 等 的 ， 这 一 点 使 得 恢复 过 程 变 得 复杂 起 来 。 
例如 ， 两 次 插入 相同 的 行 与 只 插入 一 次 的 结果 是 不 一 样 的 9 。 这 样 ， 在 第 2 遍 处 理 更 新 和 补偿 

eg 
如 果 已 刷 人 了 ， 那么 在 第 2 遍 里 再 进行 重 做 将 导致 某 种 不 正确 的 状态 。 在 上 面 的 例子 中 ， 如 
果 包 含 x 的 页 面 在 濒临 骨 溃 之 际 已 写 人 了 数据 库 ， 那 么 恢复 过 程 中 的 逻辑 型 重 做 将 导致 x 揪 入 
两 次 。 

幸运 的 是 ， 使 用 页 面 中 的 LSN 可 以 很 容易 地 解决 这 个 问题 。 如 果 在 第 2 遍 中 发 现 ， 某 一 页 
中 的 LSN 大 于 或 等 于 该 页 中 某 一 一 数据 项 的 更 新 记录 的 LSN (表示 该 页 包含 了 实施 该 更 新 操作 
的 结果 )， 那 么 就 不 要 执行 重 做 操作 。 

第 二 个 问题 比较 严重 。 例 如 ， 元 论 元 组 :是 否 已 经 插入 革 个 天， 我 们 都 隐 式 地 假设 逻辑 型 


eS \ 
O 不 妨 回 想 一 下 ， 关 系数 据 库 未 必 一 定 检查 重复 行 。 
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操作 是 自动 地 进行 的 。 然 而 ， 为 了 执行 一 个 插入 操作 ， 可 能 需要 修改 许多 页 面 ， 因 此 相对 下 
述 故障 来 说 ， 该 逻辑 型 操作 就 不 是 原子 化 的 。 该 故障 为 系统 在 部 分 (而 非 所 有 ) 页 面 写 入 以 
后 就 崩溃 了 。 因 此 ， 数 据 可 能 在 恢复 过 程 中 处 于 不 一 致 的 状态 。 这 里 的 不 一 致 性 的 形式 有 所 
不 同 。 例 如 ， 包 含 t 的 数据 页 面 可 能 已 经 写 人 海量 存储 器 ， 但 是 缺少 包含 有 指向 t 的 指针 的 索引 
页 。 这 和 不 一 致 的 事务 所 引起 的 不 一 致 状态 是 不 一 样 的 ， 因 为 这 里 的 不 一 致 并 非 是 数据 值 的 
不 一 致 ， 而 是 数据 储存 方式 的 不 一 致 。 

应 用 逻辑 型 操作 来 解决 不 一 致 状态 问题 很 可 能 会 失败 。 在 本 例 中 ， 第 2 遍 逻 辑 型 重 做 记录 
的 应 用 可 能 导致 该 表 中 t 有 两 份 拷贝 。 这 在 采用 物理 型 登录 时 是 没有 问题 的 。 在 采用 逻辑 型 合 
录 时 ， 倘 若 罗 辑 型 操作 仅仅 影响 到 一 个 页 面 ， 这 也 不 成 问题 。 因 为 这 时 操作 的 执行 是 原子 化 
的 ， 而 且 其 LSN 指 示 出 该 操作 究竟 有 没有 发 生 。 

为 了 解决 这 一 问题 ， 可 以 使 用 物理 逻辑 型 登录 (physiological logging )。 这 项 技术 是 物理 
型 登录 和 逻辑 型 登录 的 折 中 (其 名 字 是 复杂 描述 ppysical-to-a-page,， logical-within-a-page, Bp 
“物理 到 页 、 逻 辑 页 内 ”的 一 种 缩写 )。 一 个 涉及 多 页 更 新 的 逻辑 型 操作 被 分 解 为 多 个 (逻辑 
型 ) 微型 操作 (mini-operation)。 通 过 这 种 方式 ， 每 一 个 微型 操作 被 限制 在 单一 页 面 里 (这 是 
物理 逻辑 型 登录 操作 的 物理 维度 )， 并 且 保 持 了 页 面 的 一 致 性 。 这 样 一 来 ,无 论 何 时 发 生 故 障 ， 
都 可 以 在 页 面 上 执行 微型 操作 。 逐 辑 操作 “把 t 插 入 表 T” 可 以 被 分 解 为 微型 操作 “把 (插入 包 
含 T 的 文件 的 某 个 特定 页 面 "， 该 操作 又 有 一 个 或 多 个 后 继 的 微型 操作 ,，“ 在 T 的 某 个 特定 索引 
页 中 插入 一 个 指向 t 的 指针 ”。 因 为 每 一 个 微型 操作 都 拥有 各 自 的 日 志 记 录 ， 所 以 即使 在 微型 
操作 执行 过 程 中 发 生 了 崩溃 ， 恢 复 过 程 也 可 以 正确 地 处 理 。 由 于 逻辑 型 微型 操作 未 必 是 略 等 
的 ， 因 此 可 以 使 用 LSN (如 上 所 述 ) 确定 第 2 遍 中 有 哪些 微型 操作 已 经 被 应 用 到 某 一 页 面 上 。 

在 上 述 例子 中 ， 每 个 微型 操作 都 是 限定 在 单一 页 面 内 的 逻辑 型 操作 。 把 一 个 数据 项 实际 
插入 某 页 面 的 工作 ， 除 了 把 该 数据 项 储存 到 该 页 面 以 外 ， 实 际 上 还 涉及 更 新 该 页 的 页 头 信息 
(用 于 找到 数据 项 以 及 该 页 的 空闲 空间 )。 因 此 ， 就 可 以 全 部 重新 组 织 该 页 面 。 使 用 物理 型 合 
录 时 ， 所 有 这 些 更 改 的 物理 映像 都 必须 保存 在 该 日 志 记 录 中 。 而 使 用 物理 逻辑 型 登录 时 ， 只 
有 微型 操作 的 性 质 〈 例 如 插入 )、 它 的 变量 (例如 t) 以 及 该 页 的 标识 必须 保存 。 如 果 微型 操 
作 不 能 方便 地 逻辑 表达 ， 那 么 可 以 使 用 物理 型 日 志 记录 。 


25.3 延迟 更 新 系统 的 恢复 


在 延迟 更 新 系统 (deferred-update system) 里 ,一 个 事务 的 写 入 操作 并 没有 更 新 数据 库 中 
的 相应 的 数据 项 。 相 反 ， 这 些 信 息 保存 在 一 个 称 为 该 事务 的 意向 列表 (intention list) 的 特殊 
的 内 存 区 域 里 。 该 意向 列表 并 不 长 期 存储 。 如 果 该 事务 提交 的 话 ， 它 的 意向 列表 就 用 来 更 新 
数据 库 。 

当 我 们 要 异常 中 止 这 样 的 事务 的 时 候 ， 只 要 抛弃 它 的 意向 列表 就 可 以 了 。 类 似 地 ， 如 果 
系统 崩溃 的 话 ， 我 们 无 需 采取 特别 的 措施 来 异常 中 止 活动 的 事务 ， 因 为 它们 并 没有 修改 数 
据 库 。 

对 于 已 经 提交 的 事务 ， 为 了 实现 持久 性 ， 可 以 使 用 日 志和 日 志 缓 冲 区 体系 结构 。 为 简单 
起 见 ， 在 以 下 讨论 中 ， 我 们 假设 采用 物理 型 登录 方式 。 

当 事 务 更 新 一 个 数据 项 时 ， 系 统 除 了 把 更 新 保存 到 该 事务 的 意向 列表 里 外 ， 还 要 把 包含 
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后 像 的 更 新 记录 追加 到 日 志 缓冲 区 里 。 在 这 种 情况 下 ， 既 不 需要 先 写 性 ， 也 无 需 在 更 新 记录 
中 包含 前 像 ， 因 为 该 数据 库 项 一 直 要 等 到 其 事务 提交 后 才 更 新 。 当 此 事务 提交 时 ， 系 统 把 一 
条 提交 记录 追加 到 日 志 缓冲 区 里 ， 随 后 它 被 强制 移 到 非 易 失 型 存储 器 的 日 志 中 。 由 于 在 日 志 
中 更 新 记录 是 先 于 提交 记录 的 ， 所 以 该 提交 记录 的 强制 ， 保 证 所 有 的 更 新 记录 也 都 移 到 了 非 
易 失 型 存储 器 里 。 当 提交 操作 完成 以 后 ,系统 便 根据 该 事务 的 意向 列表 来 更 新 数据 库 内 容 ， 
然后 释放 它 所 持 有 的 锁 ， 并 且 向 该 日 志 写 人 一 条 结束 记录 (completion record). 

系统 可 能 在 该 事务 已 经 提交 ， 但 尚未 完成 所 有 的 数据 库 更 新 时 崩溃 。 由 于 该 事务 的 意向 
列表 已 丢失 ， 恢 复 过 程 只 得 使 用 其 日 志 来 完成 该 事 务 的 更 新 安装 。 为 加 速 这 一 过 程 ， 系 统 周 
期 性 地 向 该 日 志 追 加 一 条 检测 点 记录 ，、 其 中 包含 了 其 意向 列表 正 被 用 于 更 新 此 数据 库 的 已 提 
交 事 务 的 标识 。 重 新 启动 后 ， 恢 复 过 程 需要 确定 在 崩溃 发 生 时 ， 其 意向 列表 还 未 处 理 完成 的 
已 提交 事务 的 标识 。 为 了 实现 这 一 目标 ， 需 要 利用 结束 记录 及 与 上 述 精确 检测 点 类 似 的 某 个 
算法 ， 通 过 反 向 扫描 该 日 志 ， 找 到 最 近 的 检测 点 记录 。 然 后 ， 再 利用 这 些 事务 的 更 新 记录 来 
更 新 此 数据 库 。 因 此 ， 延 迟 更 新 系统 的 恢复 类 似 于 立即 更 新 系统 恢复 过 程 的 第 2 遍 。 

值得 注意 的 是 ， 恢 复 过 程 不 再 关注 回 退 由 崩溃 时 尚 在 活动 的 事务 所 懂行 的 数据 库 更 新 
(第 3 遍 )， 因 为 活动 事务 并 设 有 更 新 数据 库 。 因 此 ， 检 测 点 记录 只 列 出 了 未 完成 的 事务 。 


25.4 介质 故障 的 恢复 


持久 性 要 求 已 提交 事务 写 入 的 所 有 信息 都 不 得 委 失 。 因 此 ， 我 们 现在 需要 孝 虐 介质 故障 。 

实现 持久 性 的 一 种 简单 的 方法 是 ， 在 两 台 不 同 的 非 易 失 型 设备 〈 可 能 由 不 同 的 电源 供电 ) 
上 维护 该 数据 库 的 两 份 不 同 的 拷贝 ， 这 样 的 两 台 设备 不 太 可 能 同时 发 生 故障 。 镜 像 化 磁盘 就 
是 实现 这 种 方法 的 方式 之 一 。 镜 像 化 磁盘 (mirrored disk) 是 一 种 大 容量 存储 系统 ， 每 当 提 出 
写 和 一 条 记录 的 请 求 时 ， 该 系统 就 在 两 个 不 同 的 磁盘 中 都 写 人 同一 条 记录 。 因 此 每 一 个 磁盘 
都 是 另 一 个 磁盘 的 精确 拷贝 ， 或 称 为 镜像 (mirror image)。 此 外 ， 这 个 双重 写 入 操作 对 于 请 
求 者 是 透明 的 。 | 

如 果 出 现 的 只 是 单一 介质 故障 ， 那 么 储存 在 镜像 化 磁盘 中 的 数据 库 就 是 持久 的 。 此 外 ， 
如 果 其 中 一 个 镜像 化 磁盘 发 生 了 故障 ， 该 系统 仍然 保持 可 用 ， 因 为 可 以 利用 另 一 个 磁盘 继续 
操作 。 当 置换 发 生 故 障 的 磁盘 以 后 ， 系 统 必须 对 两 个 磁盘 实施 再 同步 化 。 与 之 相反 ， 当 采用 
日 志 来 达到 持久 性 时 (下文 进 行 描述 )， 恢 复 一 次 介质 故障 可 能 需要 花费 相当 长 的 时 间 ， 在 此 
期 间 ， 用 户 不 能 使 用 该 系统 。 

即便 是 使 用 镜像 化 磁盘 的 立即 更 新 系统 ， 也 必须 利用 先 写 型 日 志 来 实现 原子 性 。 因 此 ， 
每 当 一 个 事务 异常 中 止 时 ， 仍 然 需要 用 前 像 来 回 退 数据 库 项 ; 每 当 一 个 事务 提交 时 ， 也 仍然 
需要 用 后 像 来 前 滚 数据 库 项 。 

实现 持久 性 的 第 二 种 方法 是 ， 一 旦 出 现 介质 故障 ， 就 根据 其 日 志 来 对 数据 库 进 行 复原 。 
达到 这 个 目标 的 一 个 办 法 是 从 该 日 志 起 点 开始 ， 通 过 更 新 记录 的 后 像 正 向 推演 该 日 志 。 然 而 ， 
考虑 到 日 志 的 大 小 ， 这 个 办 法 是 不 现实 的 。 这 需要 耗费 大 量 的 时 间 ， 而且 在 这 一 过 程 中 ， 系 
统 是 无 法 使 用 的 。 另 一 个 解决 办 法 是 ， 周 期 性 地 对 数据 库 做 一 份 存档 拷贝 (archive copy), 
即 转 储 (dump). 

使 用 转 储 进 行 恢 复 取决 于 转 储 的 实施 方式 。 对 于 某 些 应 用 程序 ， 可 以 脱 机 进行 转 储 。 系 
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统 在 适当 的 时 候 就 不 允许 开始 新 的 事务 ， 并 且 等 到 现 有 活动 事务 都 已 经 终止 ,这 时 系统 就 关 
闭 。 然 后 开始 实施 转 储 。 一 旦 转 储 实施 完毕 ， 系 统 就 重新 启动 。 为 了 在 介质 故障 后 恢复 数据 
库 ， 重 新 启动 后 ， 系 统 首先 使 用 转 储 文件 ， 然 后 对 转 储 记录 之 后 追加 的 日 志 记 录 处 理 两 记 : 
1) 一 次 反 向 扫描 ， 产 生 所 有 转 储 后 已 提交 的 事务 的 一 张 列表 ，2) 一 次 正 向 扫描 ， 把 上 述 列表 
中 所 有 事务 的 重 做 记录 复制 到 数据 库 里 。 

模糊 转 储 

在 许多 应 用 程序 中 ， 系 统 是 不 能 关闭 的 。 这 就 需要 在 系统 的 运行 过 程 中 进行 模糊 转 储 
(fuzzy dump )。 模 糊 转 储 就 是 无 视 锁 的 存在 ， 顺 序 读 取 该 数据 库 里 的 所 有 记录 。 这 样 ， 事 务 
可 以 一 边 执行 转 储 ， 一 边 更 新 记录 ， 以 后 再 提交 或 异常 中 止 事 务 。 该 转 储 程序 在 这 些 记 录 写 
入 以 前 或 者 以 后 都 可 以 读 取 它们 。 

让 我 们 考虑 一 个 使 用 物理 型 登录 的 立即 更 新 系统 。 如 果 上 述 的 两 遍 恢 复 过 程 采用 模糊 转 
储 ， 那 么 第 2 遍 CER) 扫描 (从 该 日 志 ) 恢复 自 启动 转 储 (start dump) 后 提交 的 事务 所 写 
入 的 每 一 个 数据 库 项 的 值 ， 而 不 管 转 储 是 否 真正 读 取 过 该 值 。 如 图 25-8a 所 示 ， 转 储 记 录 的 x 
的 值 反 映 了 7 的 影响 , 但 是 y 的 值 却 不 能 反映 这 一 影响 。 然而， 由 于 7 的 提交 是 在 转 储 开始 之 后 ， 
所 以 ， 所 有 修改 的 后 像 都 将 用 于 由 该 转 储 启动 的 数据 库 重 构 。 这 对 于 x 是 不 需要 的 ， 可 是 需要 
前 滚 y 到 它 的 正确 值 。 该 恢复 过 程 也 可 处 理 图 25-8b 所 示 的 情况 。 其 中 某 个 事务 在 转 储 完成 后 
再 启动 ， 但 后 来 异常 中 止 了 ， 因 为 它 的 更 新 记录 在 第 2 遍 中 忽略 了 。 

但 是 两 遍 扫 描 过 程 并 不 能 正确 地 处 理 以 下 两 种 情况 : 

“ 在 转 储 开始 前 提交 的 事务 7 所 写 的 数据 库 页 面 在 转 储 完成 之 前 可 能 未 被 号 人 数据 库 。 在 

这 种 情况 下 ， 转 储 不 包含 7 写 的 新 值 ， 但 是 7 不 包含 在 第 1 遍 扫描 获得 的 记录 已 提交 事务 

的 列表 里 ， 这 些 事务 的 更 新 记录 在 第 2 遍 扫描 中 用 来 前 滚 数据 库 的 值 。 这 种 情况 的 发 生 

是 因为 7 的 提交 记录 位 于 转 储 记录 之 前 ， 而 且 正 向 扫描 是 从 转 储 记录 开始 的 。 

。 转 储 有 可 能 读 取 在 转 储 时 活动 但 后 来 异常 中 止 的 事务 所 写 入 的 值 。 在 这 种 情况 下 ， 转 

储 中 记录 的 该 值 不 会 被 回 退 。 这 种 情况 如 图 25-8c 所 示 。 

为 了 解决 这 些 问题 ， 模 糊 转 储 采 取 与 模糊 检测 点 相同 的 策略 。 

1) 在 开始 转 储 之 前 ， 先 将 图 25-7 所 示 的 检测 点 记录 CK2 追 加 到 日 志 里 ， 其 后 紧 接着 一 条 
转 储 开始 (begin dump) 记录 。 正 如 此 图 所 示 ， 日 志 中 CK2 的 出 现 确保 当 CK1 追 加 时 ， 出 现在 
高 速 缓存 中 的 所 有 的 脏 页 面 已 经 写 和 数据库， 因而 也 记录 在 转 储 里 。 

2) 补偿 日 志 记 录用 来 记录 异常 中 止 处 理 时 对 于 更 新 的 逆 操作 。 

为 了 恢复 数据 库 ， 系 统 首 先 重 载 转 储 文件 ， 然 后 对 日 志 做 如 下 三 遍 扫描 : 

* 第 1 遍 扫描 处 理 从 日 志 尾 部 开始 ， 反 向 扫描 到 最 近 的 检测 点 记录 。 在 这 一 遍 扫描 中 ， 

系统 产生 一 个 包含 所 有 故障 发 生 时 还 处 于 活动 状态 的 事务 列表 L， 

“第 2 遍 扫描 处 理 从 转 储 开始 时 第 2 个 最 近 检 测 点 记录 (图 25-7 中 的 CK1) Fi, EAA 

描 到 日 志 的 结尾 。 在 这 一 一 间 相 往 中 ， 系 统 使 用 所 有 事务 的 重 做 记录 。 从 转 储 中 记录 的 

状态 开始 来 前 滚 数据 库 。 

“第 3 遍 ”扫描 处 理 从 日 志 尾 部 开始 ， 反 向 扫描 到 中 最 早 的 菜 一 一 事务 的 开始 记录 。 在 这 一 

遍 扫描 中 ， 系 统 使 用 L 中 所 有 事务 的 撤销 记录 来 回 退 它们 的 影响 。 

对 于 那些 可 能 未 包含 在 转 储 中 的 更 新 ， 它们 的 所 有 重 做 记录 (包括 补偿 日 志 记 录 ) 在 第 2 饥 
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扫 搞 处 理 中 都 被 重演 。 这 样 ， 在 第 2 遍 扫描 结束 时 ， 数 据 库 的 状态 将 从 转 储 中 记录 的 状态 前 滚 
为 故障 发 生 时 的 状态 。 仅 有 介质 故障 发 生 时 仍 处 于 活动 状态 的 事务 所 产生 的 影响 需要 消除 ， 
这 些 工 作 在 第 3 遍 扫 描 里 完成 。 


Tx Ty TS PE 
时 间 
启动 转 储 转 储 读 取 x 和 y 结束 转 储 
a) 
”了 开始 Tx 7 异常 中 止 
时 间 
启动 转 储 结束 转 储 
b) 
Tx 7 异常 中 止 K 
时 间 > 
启动 转 储 ” 转 储 读 取 x 结束 转 储 


c) 
图 25-8 实施 转 储 时 活动 事务 的 作用 


总 之 ， 介 质 故 障 的 恢复 需要 数据 库 的 最 近 转 储 以 及 一 部 分 日 志 ， 这 部 分 日 志 包括 了 没有 
包含 在 转 储 中 的 所 有 的 更 新 操作 的 全 部 更 新 记录 。 应 该 注意 到 ， 该 部 分 日 志 通 常 比 崩溃 恢复 
需要 的 部 分 大 一 些 。 这 两 部 分 都 必须 包括 最 早 活动 事务 的 开始 记录 。 然 而 ， 崩 省 恢复 还 需要 
包括 两 个 最 近 检 测 点 记录 的 那 部 分 日 志 ， 而 介质 恢复 需要 转 储 开始 前 的 两 个 检测 点 记录 。 此 
外 ， 如 果 最 近 存 档 的 数据 库 拷贝 被 损坏 ， 那 么 利用 相同 的 算法 可 以 把 数据 库 恢复 到 某 个 更 早 
的 拷贝 。 

使 用 物理 逻辑 型 登录 ， 不 用 在 第 2 遍 和 第 3 遍 扫描 中 不 分 青红皂白 地 应 用 前 像 和 后 像 ， 可 
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以 像 25.2.3 节 描述 的 那样 使 用 LSN 来 确定 是 否 应 该 应 用 某 项 操作 。 
25.5 参考 书目 


[Gray 1978] 是 最 早 讨论 登录 和 恢复 技术 的 文献 之 一 。 当 前 技术 大 多 是 建立 在 System R[Gray et al. 


1981] 和 Aries (Algorithm for Recovery and Isolation Exploiting Semantics) [Mohan et al. 1992] 的 实现 的 

基础 之 上 的 。 在 [Haerder and Reuter 1983, Bernstein and Newcomer 1997, Gray and Reuter 1993] 里 包含 

有 关于 该 技术 的 精彩 概述 。 关 于 故障 的 一 个 更 为 抽象 的 观点 ， 即 把 恢复 和 可 串 行 化 集成 到 单个 模型 中 , 
. 是 在 [Schek et al. 1993] 里 描述 的 。 


25.6 练习 


25.1 


25.9 
25.10 


请 描述 以 下 日 志 记 录 的 内 容 ， 以 及 在 从 崩溃 和 介质 故障 中 回 退 与 恢复 时 ， 如 何 利 用 这 些 记 录 ? 
a. 异常 中 止 记 录 f. 补偿 日 志 记 录 

b. 开始 记录 g. 结束 记录 

c. 转 储 开始 记录 h. 重 做 记录 

d. 检测 点 记录 i. 存储 点 记录 

e. 提交 记录 j 撤销 记录 


假设 并 发 性 控制 采用 表 锁 ， 某 个 事务 是 完成 对 一 张 表 里 的 一 个 元 组 的 一 个 属性 的 值 进行 更 新 的 操 

作 。 那 么 该 更 新 记录 应 当 包 含 整 张 表 的 映像 还 是 仅仅 一 个 元 组 的 映像 ? 

假设 由 于 两 个 活动 事务 写 人 而 在 高 速 缓 存 里 产生 了 某 个 脏 页 ， 其 中 一 个 事务 想 要 提交 。 请 描述 高 

速 缓存 过 程 此 时 该 如 何 工作 ? 

假设 数据 库 崩 溃 发 生 在 某 个 事务 提交 (通过 向 日 志 追 加 一 条 提交 记录 ) 和 它 要 释放 其 锁 时 刻 之 间 。 

请 描述 在 这 种 情况 下 系统 是 如 何 恢复 的 ? 

请 解释 为 什么 在 追加 异常 中 止 记 录 时 ， 日 志 缓冲 区 不 必 进 行 刷 新 ? 

请 解释 为 什么 当 物理 型 登录 同时 使 用 高 速 缓存 和 日 志 缓 冲 区 时 ， 在 数据 库 保存 的 页 面 上 无 须 包 括 

LSN? 

假设 每 个 数据 库 页 都 包含 最 后 一 个 把 某 数据 库 项 提交 并 写 入 该 页 的 事务 的 提交 记录 的 LSN， 而 该 

系统 采取 的 策略 是 ， 在 日 志 缓冲 区 中 的 最 早 记 录 的 LSN 大 于 该 页 的 LSN 之 前 ， 不 使 用 高 速 缓存 对 

该 页 进行 刷新 。 是 否 需 要 强制 使 用 先 写 性 策略 ? 

精确 检测 点 恢复 过 程 的 第 2 遍 扫描 如 下 : 从 检测 点 正 向 扫描 日 志 。 使 用 所 有 更 新 记录 中 的 后 像 来 更 

新 相应 的 数据 库 项 。 证 明 这 种 更 新 可 以 按 下 述 两 种 顺序 完成 : 

a. 每 当 正 向 扫描 磁 到 一 个 更 新 记录 时 ， 便 完成 相应 的 数据 库 更 新 操作 (即使 有 不 同 的 事务 的 更 新 
记录 在 日 志 中 交合 )。 

b 在 正 向 扫描 时 ， 每 个 事务 的 更 新 记录 保存 在 易 失 型 存储 器 中 ， 而 对 于 每 个 事务 的 数据 库 更 新 ， 
则 是 在 正 向 扫描 磁 到 该 事务 的 提交 记录 时 ， 一 次 性 地 全 部 完成 的 。 

请 说 明 在 准确 检测 点 恢复 过 程 里 ， 当 利用 日 志 的 后 像 更 新 数据 库 时 ， 系 统 是 否 必须 获得 锁 ? 

考虑 下 述 利 用 精确 检测 点 和 物理 型 登录 进行 崩溃 恢复 的 两 遍 策 略 : 第 1 遍 是 反 向 扫描 ， 在 这 一 遍 
中 对 活动 事务 进行 回 退 。 至 于 如 何 确定 活动 事务 ， 请 参见 25.2 节 。 第 1 遍 至 少 一 直 延 伸 到 碰 到 最 
早 活动 事务 的 开始 记录 或 最 近 的 检测 点 记录 为 止 ， 无 论 哪个 在 日 志 里 更 早出 现 。 在 扫描 时 ， 每 当 
碰 到 这 些 事务 的 更 新 记录 ， 便 对 数据 库 应 用 它们 的 前 像 。 第 2 遍 是 从 最 近 检 测 点 记录 开始 正 向 扫 
描 ， 利 用 后 像 来 前 滚 从 已 写 人 的 检测 点 记录 以 来 ， 事 务 所 作出 的 所 有 变更 (补偿 日 志 记录 是 按 与 
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通常 的 更 新 记录 相同 的 方式 进行 处 理 的 ， 以 便 使 已 异常 中 止 的 事务 得 到 正确 的 处 理 )。 该 过 程 能 
否 正 常 工作 ? 

25.11 为 了 使 逻辑 型 登录 能 工作 ， 一 个 逻辑 型 数据 库 操作 必须 要 有 一 个 逻辑 型 逆 操 作 。 请 给 出 没有 任何 
逆 操 作 的 数据 库 操作 的 例子 。 请 建议 一 个 包括 能 够 处 理 这 种 情况 的 逻辑 型 日 志 的 过 程 。 

25.12 请 考虑 在 使 用 逻辑 型 登录 时 ， 利 用 在 25.2 节 所 描述 的 崩溃 恢复 程序 ( 意 指 物理 型 登录 ) 。 请 说 明 
该 过 程 应 当 如 何 修改 来 处 理 在 恢复 时 出 现 的 骨 溃 ? 假设 每 次 更 新 的 影响 局 限于 单个 页 面 。 

25.13 请 说 明 在 延迟 更 新 系统 里 ， 作 为 立即 更 新 系统 一 部 分 的 先 写 性 ， 为 什么 在 数据 库 项 更 新 时 却 没 有 
使 用 ? 

25.14 请 说 明 为 什么 在 延迟 更 新 系统 里 ， 系 统 不 是 首先 把 意向 列表 拷贝 到 数据 库 里 ， 然 后 向 日 志 追 加 提 
交 记 录 ? 

25.15 假设 系统 支持 SNAPSHOT 隔 离 。 请 说 明 为 什么 元 须 关闭 系统 就 可 以 实施 精确 ( 非 模 糊 ) 转 储 ? 

25.16 a. 请 说 明 你 的 本 地 DBMS 里 ， 日 志 是 如 何 实现 的 ? 
b. 请 估计 你 的 本 地 DBMS 里 ， 提 交 一 次 事务 需要 多 少 毫 秒 ? 

25.17 存放 在 数据 库 页 里 的 LSN 可 看 作 日 志 里 的 描述 该 页 最 近 更 新 的 一 个 更 新 记录 。 假 设 某 个 事务 完成 
了 对 某 页 的 最 后 的 更 新 ， 而 后 来 却 异 常 中 止 了 。 了 既然 它 对 该 页 的 更 新 已 经 被 逆转 ， 那 么 该 页 的 
LSN 就 不 再 能 看 作为 合适 的 更 新 记录 。 为 什么 在 本 书 的 登录 描述 里 ， 这 不 是 一 个 问题 呢 ? 

25.18 一 个 机 票 预 售 系统 需要 具备 性 能 标准 和 可 用 性 标准 。 以 下 角色 是 否 在 增强 性 能 方面 起 作用 ? 它们 
能 提高 可 用 性 吗 ? 请 说 明 你 的 理由 。 
a. 页 高 速 缓 存 
b. 日 志 缓冲 区 
c. 检测 点 记录 
d. 物理 逻辑 型 登录 
e. 镜像 化 磁盘 
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26.1 ACID 特 性 的 实现 


分 布 式 事务 (distributed transaction) 是 指 通 过 网 络 在 不 同 的 站 点 上 访问 资源 管理 器 。 当 
此 资源 管理 器 是 数据 库 管理 程序 时 ， 我 们 把 该 系统 称 为 分 布 式 数据 库 系统 (distributed 
database System ) 。 每 个 本 地 数据 库 管理 程序 都 可 以 导出 预先 存储 的 子 程序 ， 供 分 布 式 事务 T 
作为 子 事务 调用 。 事 务 T 也 可 以 提交 单独 的 SQL 语句 ， 供 数据 库 管 理 程序 执行 。 在 这 种 情况 下 ， 
所 提交 的 SQL 语句 序列 就 会 在 此 管理 程序 中 成 为 T 的 子 事务 。 一 般 来 说 ，I 的 子 事务 既 可 以 顺 
序 执行 ， 也 可 以 并 发 执行 ， 而 且 一 个 子 事务 的 结果 可 能 会 影响 到 其 他 子 事务 的 执行 。 

当 数 据 库 系统 所 支持 的 组 织 是 分 散 的 ， 并 且 包 含 着 各 自 固有 的 部 分 数据 时 ， 分 布 式 数据 
库 是 十 分 有 用 的 。 可 以 通过 把 数据 存放 于 访问 频 度 最 高 的 站 点 上 将 通信 成 本 降 到 最 小 。 而 且 ， 
因为 单个 站 点 的 故障 失效 并 不 妨碍 其 余 站 点 上 的 继续 操作 ， 所 以 系统 的 有 效 性 也 得 到 提升 。 
例如 ， 学 生 注册 系统 就 可 以 作为 一 个 分 布 式 系统 来 实现 。 学 生 的 信息 是 存储 在 某 台 电脑 上 的 ， 
而 课程 的 信息 则 可 能 是 存储 在 另外 一 台电 脑 上 的 。 这 两 台电 脑 也 许 被 放置 在 校园 内 不 同 的 大 
楼 里 。 : 
我 们 在 第 18 章 讨论 过 与 分 布 式 数 据 库 系统 有 关 的 数据 库 和 查询 设计 的 话题 。 在 本 章 中 ， 
我 们 将 讨论 与 分 布 式 事 务 有 关 的 话题 。 我 们 把 单个 的 、 执 行 某 个 全 局 性 事务 的 子 事务 的 数据 
库 管 理 程序 称 为 该 事务 的 伴随 程序 (cohort)。 一 个 为 全 局 性 事务 执行 子 事务 的 数据 库 管 理 程 
序 ， 是 这 个 全 局 性 事务 的 伴随 程序 ， 并 且 有 可 能 同时 是 许多 全 局 性 事务 的 伴随 程序 。 

我 们 希望 每 一 个 分 布 式 事务 都 能 满足 ACID 特性 。 主 要 负责 处 理 此 工作 的 模块 被 称 为 协调 
程序 (coordinator)。 在 绝 大 多 数 系统 中 ， 事 务 管理 程序 就 是 协调 程序 。 

分 布 式 事务 的 伴随 程序 分 散在 网 络 各 处 。 数 据 管理 程序 不 仅仅 作为 网 络 中 任意 站 点 的 分 
布 式 事务 的 伴随 程序 ， 同 时 还 为 本 地 的 传统 的 (单一 来 源 ) 事务 的 提供 服务 。 鉴 于 数据 库 管 
理 程 序 并 不 区 分 本 地 事务 与 全 局 性 事务 的 子 事务 ， 所 以 我 们 常常 把 它们 统称 为 “事务 ”"。 图 
26-1 显 示 了 某 个 分 布 式 事务 的 数据 访问 路 径 。 

现 考虑 某 硬件 制造 厂商 在 全 国 范围 内 的 分 布 式 系 统 。 该 公司 维护 着 一 个 其 站 点 遍布 全 国 
的 仓库 网 络 、 每 个 站 点 拥有 各 自 的 本 地 数据 库 ， 本 地 数据 库 中 包含 着 本 站 点 的 库存 信息 。 某 
站 点 的 一 个 客户 可 能 会 启动 一 个 事务 来 申请 100 打 零件 。 该 事务 读 取 当 前 本 地 仓库 中 包含 零件 
数量 的 数据 项 ， 发 现 本 地 仓库 中 只 有 10 打 。 它 (暂时 地 ) 先 预 订 了 10 打 ， 随 后 访问 其 他 的 一 
个 或 多 个 站 点 的 数据 ， 以 预订 其 余 的 90 打 零件 。 当 所 有 的 100 打 零件 都 已 找到 且 预 订 后 ， 相 应 
站 点 中 的 有 关 数 据 便 会 相应 减少 ， 并 产生 相应 的 装运 命令 。 倘 若 事务 无 法 找到 100 打 零件 ， 它 
便 会 释放 所 有 预订 的 零件 并 提交 ， 并 向 客户 返回 失败 状态 。 在 这 种 方式 下 ， 要 么 所 有 的 站 点 
都 在 其 本 地 数据 库 中 减 掉 被 预定 的 零件 数量 ， 要 么 就 全 都 什么 也 不 做 。 ' 
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站 点 A 
图 26-1 某 分 布 式 事务 的 数据 访问 路 径 


站 点 B 


当 事 务 是 分 布 式 事务 时 ， 物 理 型 故障 会 更 加 复杂 一 些 。 我 们 在 第 25 章 中 已 看 到 ， 系 统 贿 
涡 是 故障 的 一 种 最 常见 形式 。 在 集中 式 系统 里 ,一旦 计算 机 崩溃 ， 则 与 该 事务 有 关 的 所 有 模 
块 便 全 部 失败 。 采 用 分 布 式 事务 后 ， 网 络 中 的 某 些 计算 机 的 崩溃 ， 只 会 引起 若干 模块 子 集 的 
失败 ， 而 其 余 的 模块 将 继续 执行 。 必 须 设计 一 些 特 殊 的 协议 来 处 理 这 种 新 的 故障 模式 。 

当 数据 通信 故障 导致 网 络 被 分 割 (partitioned) 时 ， 也 会 出 现 类 似 的 情况 : 运作 站 点 不 能 
彼此 通信 。 我 们 将 在 本 章 的 后 面 讨论 此 类 故障 的 处 理 方法 。 我 们 假设 一 个 事务 可 以 异常 中 止 
( 因此 必须 是 可 复原 的 ); 同时 假设 一 旦 事务 (在 所 有 的 站 点 ) 提交 ， 系 统 必 须 确保 所 有 的 站 
点 的 数据 闫 变更 都 是 持久 性 的 。 

如 果 我 们 假设 每 一 个 站 点 都 支持 本 地 ACID 特 性 ; 并且 确保 没有 任何 本 地 的 死 锁 ， 那 么 分 
布 式 事务 处 理 系统 同样 也 会 确保 有 如 下 的 结果 : 

“原子 化 终止 分 布 式 事务 的 所 有 伴随 程序 ， 必 然 是 要 么 全 部 提交 ， 要 人 么 全 部 异常 中 止 。 

"没有 任何 全 局 死 锁 必然 没有 任何 涉及 多 个 站 点 的 全 局 (分 布 式 ) FEB. 

“全 局 可 串 行 化 ”必然 存在 包括 (分布 式 或 本 地 的 ) 所 有 事务 在 内 的 一 种 ( 爹 局 型 ) ah 

行 化 实施 。 

我 们 将 在 本 章 中 讨论 以 上 话题 。 同 时 考虑 数据 复制 以 及 与 网 络 中 数据 的 分 布 有 关 的 话题 。 


26.2 原子 终止 


为 了 保证 全 局 原子 性 ， 分 布 式 事务 只 有 在 其 所 有 子 事务 都 提交 时 ， 才 能 提交 。 即 使 其 个 
子 事务 已 经 完成 其 所 有 的 操作 ， 而 且 已 做 好 提交 的 准备 ， 事 务 也 不 能 单方 面 地 决定 提交 ， 因 
为 其 他 的 子 事务 有 可 能 异常 中 止 (或 许 已 经 异常 中 止 )。 在 那 种 情况 下 ， 整 个 分 布 式 事务 也 必 
须 异常 中 止 。 因 此 ， 当 某 个 子 事务 已 成 功 地 完成 时 ， 它 也 必须 等 待 ， 直 到 所 有 其 他 子 事务 都 
完成 后 ， 才 能 提交 。 

协调 程序 是 通过 执行 原子 提交 协议 (atomic commit protocol) 来 保证 念 局 原子 性 的 ， 图 
26-2 显 示 的 是 与 该 协 议 有 关 的 通信 路 径 。 当 一 个 应 用 程序 启动 某 个 分 布 式 事务 T 时 ， 它 先 通 知 
其 协调 程序 ， 然 后 设 定 其 初始 事务 边界 。 每 当 T 首 次 调用 某 个 资源 管理 器 的 服务 时 ， 该 管理 程 
序 便 立即 通知 其 协调 程序 它 将 要 与 该 事务 相 联结 。 当 事务 T 完 成 时 ， 此 应 用 程序 便 会 通知 其 协 
调 程序 ， 接 着 设 定 其 最 终 的 事务 边界 。 然 后 ， 其 协调 程序 再 启动 此 原子 提交 协议 。 
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图 26-2 与 协议 有 关 的 通信 路 径 


原子 性 要 求 当 T 完 成 时 ， 要 么 所 有 的 伴随 程序 都 提交 它们 的 变更 、 要 么 全 都 异常 中 止 。 因 
此 ， 在 处 理 T 的 提交 要 求 时 ， 协 调 程序 必须 首先 确定 是 否 所 有 的 伴随 程序 都 同意 提交 。 以 下 是 
一 个 伴随 程序 可 能 无 法 提交 的 一 些 原因 : 

“ 某 伴随 程序 站 点 的 模式 可 能 规定 有 延迟 约束 检测 (参见 10.3 节 )。 当 该 站 点 的 子 事务 完 

成 时 ,数据库 管理 程序 可 能 判定 此 约束 遭 到 破坏 ， 并 异常 中 止 该 子 事务 。 
“ 某 伴随 程序 站 点 的 数据 库 管理 程序 可 能 采用 乐观 型 并 发 性 控制 。 当 该 站 点 的 子 事务 完成 
时 ， 该 管理 程序 便 执行 确认 过 程 。 一 旦 确认 失败 ， 该 管理 程序 就 异常 中 止 此 子 事务 。 
“因为 (本 地 的 ) 死 锁 或 者 与 其 他 子 事务 (或 本 地 事务 ) RE (本 地 ) 冲突 ， 子 事务 可 能 
被 (本 地 的 ) 并 发 性 控制 异常 中 止 。 

o “该 伴随 程序 站 点 可 能 崩溃 ， 因 此 无 法 响应 协调 程序 发 出 的 协议 消息 。 
© 某 些 通信 线路 可 能 已 失效 ， 这 妨碍 了 该 伴随 程序 站 点 响应 协调 程序 发 出 的 协议 消息 。 


26.2.1 两 阶段 提交 协议 


我 们 所 要 描述 的 特殊 的 原子 提交 协议 被 称 为 两 阶段 提交 协议 (two-phase commit protocol ) 
[Gray 1978，Lampson 和 Sturgis 1979]。 一 旦 事务 请 求 提交 ， 协 调 程序 便 启动 紫 两 阶段 提交 协 
议 。 为 了 执行 协议 ， 协 调 程序 应 该 知道 该 事务 的 所 有 伴随 程序 的 标识 。 因 此 3; 当 事 务 启动 时 ， 
协调 程序 便 在 易 失 型 存储 器 里 设置 一 条 事务 记录 (transaction record), 每 当 有 某 个 资源 管理 
器 联结 到 该 事务 时 ， 它 的 标识 便 被 添加 到 此 事务 记录 里 。 因 此 ， 一旦 事务 请 求 提交 ， 此 事务 
记录 立即 便 可 拥有 其 所 有 伴随 程序 的 一 份 清单 。 

我 们 不 妨 把 该 协议 描述 成 在 协调 程序 和 伴随 程序 之 间 互 相传 递 的 一 系列 消息 。 这 些 消息 
是 通过 调用 由 事务 管理 程序 和 资源 管理 器 所 提供 的 过 程 而 发 出 的 。 

当 提 交 事 务 请 求 时 ， 协 调 程序 向 每 个 伴随 程序 发 送 一 条 准备 | (prepare) 消息 ， 开 始 了 此 
两 阶段 提交 协议 的 第 一 阶段 。 发 布 此 消息 的 目的 是 确定 伴随 程序 是 否 打 算 提 交 。 若 打算 提交 ， 
则 要 求 它 在 非 易 失 型 存储 器 上 储存 所 有 子 事务 的 更 新 记录 以 准备 提交 9 。 把 更 新 记录 保存 在 


O 只 完成 读 取 操作 的 伴随 程序 站 点 ， 可 以 实现 简化 的 协议 版 本 。 参 见 练习 26.14。 
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必 易 失 型 存储 器 中 可 以 保证 ， 车 协调 程序 随后 决定 该 事务 应 当 被 提交 ， 则 其 伴随 程序 也 能 提 

; 哪怕 该 伴随 程序 在 肯定 回答 了 准备 消息 后 ， 系 统 发 生 上 崩溃 也 没有 问题 。 

如 果 该 伴随 程序 打算 提交 ， 它 通过 强制 将 一 条 准备 记录 写 信 日志， 确保 其 更 新 记录 是 储 
存在 非 易 失 型 存储 器 上 的 。 然 后 ， 可 以 认为 它 已 进入 准备 状态 ， 并 能 够 响应 准备 消息 。 每 个 
伴随 程序 都 用 一 个 投票 (vote) 消息 来 回复 此 准备 消息 。 

倘 车 该 伴随 程序 正 打算 提交 ， 其 投票 就 处 于 就 绪 (ready) 状态 ， 否 则 ， 处 于 正在 异常 中 
JE (aborting) 状态 。 一 旦 某 个 伴随 程序 的 投票 处 于 就 绪 状 态 ， 它 就 不 得 再 改变 主意 ; 因为 协 
调 程序 就 是 利用 此 投票 来 确定 是 否 将 该 事务 作为 一 个 整体 提交 。 可 以 说 ， 该 伴随 程序 进入 了 
一 个 不 确定 时 期 (uncertain period) ; 因为 它 不 知道 协调 程序 最 终 是 提交 此 子 事务 、 还 是 将 其 
异常 中 止 。 它 必须 等 待 协调 程序 的 决定 ， 在 这 段 等 待 时 期 里 ， 在 下 述 意义 上 ,. 该 伴随 程序 受 
到 阻塞 : 它 不 能 释放 锁 ， 而 且 该 伴随 程序 数据 库 的 并 发 性 控制 不 能 异常 中 止 此 子 事务 。 这 是 
一 种 令 人 遗憾 的 情况 ， 我 们 将 在 26.6 节 再 讨论 这 个 问题 。 如 果 该 伴随 程序 投票 异常 中 止 ， 它 
就 立即 异常 中 止 子 事 务 ， 并 退出 该 协议 。 此 协议 的 第 一 阶段 到 此 就 宣告 完成 。 

该 协调 程序 接收 每 个 伴随 程序 的 投票 ， 并 将 其 记录 在 事务 记录 里 。 如 果 所 有 的 投票 都 是 
就 绪 ， 就 可 决定 事务 T 能 够 整体 地 提交 ; 同时 在 此 事务 记录 里 记 下 该 事务 已 被 提交 的 事实 ， 并 
强制 在 其 日 志 中 写 入 一 条 提交 记录 。 在 此 提交 记录 里 包含 该 事务 记录 的 一 份 拷贝 。 

对 于 采用 单一 资源 的 事务 T， 一 旦 提交 记录 被 安全 地 保存 在 非 易 失 型 存储 器 里 ，T 就 被 提 
交 了 。 这 时 ， 所 有 伴随 程序 的 全 部 更 新 记录 都 已 在 非 易 失 型 存储 器 里 ， 因 为 每 个 伴随 程序 在 
投票 之 前 都 已 强制 写 人 了 准备 记录 。 值 得 注意 的 是 ， 我 们 始终 假设 存在 一 个 总 的 日 志 系 统 ， 
其 中 , 事务 管理 程序 和 每 个 本 地 数据 库 管理 程序 都 拥有 自己 的 独立 的 日 志 。 

然后 ， 该 协调 程序 向 每 个 伴随 程序 发 送 一 条 提交 (commit) 消息 ， 催 促 其 提交 。 本 地 提 
交 过 程 如 25.2 节 所 描述 的 那样 执行 ， 涉 及 在 该 数据 库 管 理 程序 的 日 志 中 强制 写 人 此 提交 记录 
(以 表示 这 一 子 事务 已 被 提交 ) ， 释 放 锁 ， 本 地 清空 。 每 个 伴随 程序 在 完成 了 这 些 操作 后 ， 便 
向 其 协调 程序 返回 一 个 完毕 (done) 消息 ， 表 示 它 已 完成 了 协议 。 

当 该 协调 程序 接收 到 了 每 个 伴随 程序 的 完毕 消息 后 ， 它 就 在 日 志 中 添加 一 个 结束 
(complete). 记录 ， 并 且 从 易 失 型 存储 器 里 删除 该 事务 记录 。 到 此 ， 该 协议 完成 。 对 于 一 个 已 
提交 的 事务 ， 其 协调 程序 要 在 日 志 中 进行 两 次 写 入 ， 其 中 只 有 一 次 是 强制 写 人 。 

.一旦 该 协调 程序 接收 到 任何 正在 异常 中 止 的 投票 ， 它 就 将 释放 易 失 型 存储 器 中 的 事务 IT 的 
记录 ， 并 向 投票 提交 的 每 个 伴随 程序 发 出 异常 中 止 (abort) 消息 ( 凡 原 先 投票 过 异常 中 止 的 
伴随 程序 都 已 经 异常 中 止 ， 并 退出 了 此 协议 )。 该 协调 程序 并 不 在 其 日 志 里 记录 异常 中 止 ， 因 
为 此 协议 有 一 种 预想 的 异常 中 止 特性 ， 我 们 将 会 在 后 面 加 以 讨论 。 接 着 ， 读 数据 库 管理 程序 
便 异 常 中 止 此 伴随 程序 ， 并 在 其 日 志 中 写 人 一 条 异常 中 止 记 录 。 提 交 或 异常 中 止 消 息 的 到 达 ， 
标志 着 这 个 伴随 程序 结束 了 不 确定 时 期 。 

图 26-3 显 示 了 在 应 用 程序 、 IRE (事务 管理 程序 ) 和 伴随 程序 (资源 管理 器 ) 之 间 
交换 的 消息 序列 。 

H. 两 阶段 提交 协议 小 结 

我 们 该 两 阶段 提交 协议 小 结 如 下 。 





E26 Ë 分布 式 事务 的 笑 现 659 








应 用 程序 协调 程序 伴随 程序 
开始 事务 
分 配 事务 Id 
安排 事务 记录 


调用 子 事务 一 
起 一 联结 事务 
给 事务 记录 添加 伴随 程序 Id 
— 


执行 子 事务 


事务 执行 


强制 将 准备 记录 写 
人 日 志 ( 提 交 场 合 ) 


阶段 1 


投票 消息 (就 绪 /异常 中 止 ) 

将 投票 记 人 事务 记录 
强制 将 提交 记录 写 人 日 志 ( 提 交 场 合 ) a 

或 取消 事务 记录 (异常 中 止 场合 ) 


提交 /异常 中 止 消息 
本 地 提交 /异常 中 止 (释放 锁 ) 


TE 


2 


阶段 


， 完毕 (提交 场合 ) 
向 日 志 写 结束 记录 并 取消 事务 记录 (提交 场合 ) 


-一 一 返回 状态 
图 26-3 两 阶段 提交 协议 中 消息 的 交换 


第 1 阶段 

1) 该 协调 程序 向 所 有 的 伴随 程序 发 送 一 条 准备 消息 。 

2) 每 个 伴随 程序 等 待 直到 收 到 从 协调 程序 发 出 的 准备 消息 为 止 。 如 果 它 已 准备 好 提交 ， 
则 向 其 日 志 中 强制 写 人 准备 记录 ， 并 进入 一 种 本 地 控制 无 法 使 其 异常 中 止 的 状态 ， 然 后 以 投 
孙 消 息 形式 向 协调 程序 发 出 已 就 绪 的 信息 。 

倘若 此 伴随 程序 无 法 提交 ， 它 将 在 其 日 志 中 添加 一 条 异常 中 止 记录 。 或 许 它 本 来 就 已 经 
异常 中 止 。 无 论 是 哪 种 情况 ， 它 都 将 以 投票 消息 形式 向 其 协调 程序 发 送 正在 异常 中 止 的 信息 ， 
接着 回 退 此 子 事务 对 数据 库 作出 的 任何 变更 ， 并 解除 该 子 事 务 的 锁 ， 然 后 终止 参与 此 协议 。 

第 2 阶段 

1) 该 协调 程序 等 待 直到 接收 到 所 有 伴随 程序 的 投票 为 止 。 如 果 至 少 收 到 一 条 正在 异常 中 
止 的 投票 ， 它 将 决定 异常 中 止 : 向 所 有 投票 就 绪 的 伴随 程序 发 出 异常 中 止 消息 ， 释 放 其 在 易 
失 型 存储 器 里 的 事务 记录 ， 并 终止 参与 此 协议 。 

如 果 所 有 投票 都 是 就 绪 ， 该 协调 程序 将 决定 提交 (并 在 其 事务 记录 中 记 下 这 一 事实 ): 强 
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制 在 其 日 志 中 写 入 提交 记录 (包括 此 事务 记录 的 一 份 拷贝 )， 并 向 每 个 伴随 程序 发 送 提交 消息 。 
” ”2) 每 个 投票 就 绪 的 伴随 程序 都 在 等 待 接收 该 协调 程序 发 出 的 消息 。 如 果 伴 随 程序 接收 到 
的 是 一 条 异常 中 止 消息 ， 它 将 回 退 该 子 事务 对 数据 库 作出 的 任何 变更 ， 并 在 其 日 志 中 添加 一 
条 异常 中 止 记录 ， 再 解除 该 子 事务 的 锁 ， 然 后 终止 参与 此 协议 。 

如 果 该 伴随 程序 收 到 的 是 一 条 提交 消息 ， 它 将 在 其 日 志 中 强制 写 和 人 一 条 提交 记录 ， 并 释 
放 所 有 的 锁 ， 再 向 协调 程序 发 送 一 条 完毕 消息 ， 然 后 终止 参与 此 协议 。 

3) 如 果 该 协调 程序 已 提交 此 事务 ， 它 将 等 竺 直到 接收 到 所 有 伴随 程序 发 出 的 完毕 消息 。 
然后 ， 在 其 日 志 中 添加 一 条 结束 记录 ， 并 从 易 失 型 存储 器 中 删除 此 事务 记录 ， 最 后 终止 参与 
此 协议 。 

2. 多 重 域 上 的 原子 化 提交 协议 

在 分 布 式 事务 中 ,协调 程序 的 角色 可 能 会 由 多 个 事务 管理 程序 来 担当 ， 每 个 事务 管理 程 
序 都 在 不 同 的 域内 。 在 这 种 情况 下 ， 原 子 提交 协议 中 的 消息 将 如 图 26-4 那 样 沿 着 一 棵 树 的 边 
缘 遍 历 ， 叶 节点 代表 伴随 程序 ， 根 代表 控制 域 的 事务 管理 程序 ， 这 个 域 中 包含 着 启动 事务 的 
应 用 程序 。 树 的 内 节点 代表 事务 管理 程序 ， 它 在 自己 的 域 中 协调 资源 管理 器 ， 相 对 于 其 双亲 
事务 管理 程序 来 说 ， 它 起 到 伴随 程序 的 作用 。 


ep 





pe 域 DA 





图 26-4 树 结构 的 分 布 式 事务 


启动 该 事务 的 应 用 程序 向 随后 启动 该 协议 的 根 事务 管理 程序 发 出 提交 请 求 ， 它 向 其 所 有 
的 子 管理 程序 (包括 本 地 资源 管理 器 和 远程 事务 管理 程序 ) 都 发 出 准备 消息 。 一 旦 某 个 事务 
管理 程序 接收 到 一 条 准备 消息 ， 它 就 开始 了 协议 的 第 1 阶段 ， 此 时 向 其 子 事务 管理 程序 发 送 准 
备 消息 并 等 待 它们 的 投票 消息 。 根 据 收 到 的 投票 ， 它 再 以 适当 的 投票 来 响应 其 父 程序 。 本 图 
仅 展示 两 层 的 协调 程序 ， 一 般 的 分 布 式 事务 可 以 有 任意 的 层 数 。 

在 本 图 中 ， 当 域 D 的 事务 管理 程序 TMA 收 到 提交 请 求 后 ， 便 向 其 每 个 子 程序 发 送 准备 消 


7 
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息 。 当 域 Da 中 的 事务 管理 程序 TMes 接 收 到 此 准备 消息 ， 它 就 与 其 子 程序 RMa 开 始 执行 此 两 阶 
段 提交 协议 的 第 1 阶段 。 如 果 它 从 RM 处 接收 到 的 是 就 绪 投 票 ， 那 么 它 就 向 TMA 发 送 就 绪 投票 ， 
作为 对 其 准备 消息 的 回复 。 类 似 地 ，TMec 在 其 子 程序 中 执行 此 两 阶段 提交 协议 的 第 1 阶段 。 倘 
若 TMA 从 TMc 处 〈 以 及 站 点 A 的 两 个 资源 管理 器 处 ) 接收 到 就 绪 投票 ， 它 就 提交 该 事务 ; 并 向 
其 所 有 的 子 程序 发 送 提 交 消息 。 然 后 ，TMs 与 TMc 在 它们 的 子 程序 中 执行 此 协议 的 第 2 阶段 。 
通过 这 样 的 方式 ， 提 交 消息 就 沿 着 树 向 下 传播 ， 而后， 完毕 消息 又 沿 着 树 向 上 传播 。 采 用 这 
种 一 目 了 然 的 方法 ， 该 协议 可 以 推广 到 更 多 层 数 的 树 。 


26.2.2 两 阶段 提交 协议 中 故障 的 处 理 


两 阶段 提交 协议 包括 用 来 处 理 在 分 布 式 系统 中 可 能 出 现 的 各 种 故障 的 协议 。 

“假如 一 个 站 点 等 待 消息 超时 ， 那 么 执行 的 是 超时 协议 (timeout protocol). (AH A REE 

由 于 发 送 的 站 点 崩溃 、 消 息 丢 失 或 消息 投递 系统 速度 缓慢 造成 的 。) 

。 当 某 个 站 点 从 崩溃 中 恢复 时 ， 执 行 的 是 重启 动 协议 (restart protocol). 

如 果 直 到 某 些 故 障 修 复 为 止 ， 某 站 点 仍 无 法 完成 提交 协议 ， 那 么 我 们 就 称 这 个 站 点 阻塞 
(blocked )。 当 某 个 站 点 阻塞 后 ， 提 交 或 异常 中 目的 决定 将 被 推迟 一 段 时 间 。 当 某 个 伴随 程序 
站 点 采用 加 锁 并 发 控制 时 ， 非 常 不 希望 出 现 这 种 推迟 ， 因 为 在 此 站 点 中 被 该 子 事务 锁定 的 数 
据 项 无 法 被 其 他 事务 读 取 。 因 此 ， 了 解 该 两 阶段 提交 协议 在 怎样 的 状况 下 会 导致 阻塞 是 很 重 
要 的 。 我 们 会 在 下 面 讨 论 各 种 故障 的 情况 。 我 们 在 描述 这 些 情况 时 ,假设 该 协议 树 恰好 包含 
两 层 。 不过， 对 于 多 层 树 的 任意 一 对 邻接 层次 ， 在 其 父 程序 与 子 程序 之 间 懂 行 同样 的 决策 。 

1. 伴随 程序 在 等 待 准备 消息 时 超时 

伴随 程序 可 以 断定 ， 没 有 一 个 站 点 已 决定 提交 ( 因为 这 些 站 点 并 没有 投票 )。 因 此 ， 它 可 
以 决定 异常 中 止 。 倘 若 随后 到 达 一 条 准备 消息 ， 该 伴随 程序 就 可 以 简单 地 用 正在 异常 中 止 来 
回复 ， 这 能 防止 所 有 其 他 的 站 点 确定 提交 (因为 提交 决定 需要 得 到 所 有 站 点 的 提交 投票 )。 在 
这 种 方式 下 ， 全 局 的 原子 性 就 得 到 了 保证 。 

2. 协调 程序 在 等 待 投票 消息 时 超时 

此 时 的 情况 同上 例 一 样 ， 该 协调 程序 可 以 决定 异常 中 止 ， 并 向 所 有 的 伴随 程序 发 送 一 条 
异常 中 止 消 息 。 

3. 伴随 程序 在 等 待 提交 或 异常 中 止 消息 时 超时 

由 于 伴随 程序 已 投票 就 绪 ， 并 进入 了 不 确定 时 期 ， 所 以 这 种 情况 更 严重 。 它 受到 了 阻塞 ， 
除非 它 能 够 确定 其 协调 程序 已 经 做 出 某 个 决定 并 且 知 道 决 定 的 内 容 。 伴随 程序 无 法 单方 面 
地 作出 异常 中 止 或 提交 的 决定 ， 因为 其 协调 程序 可 能 会 做 出 不 同 的 决定 ， 那 样 将 违反 全 体 
一 致 性 。 

伴随 程序 可 以 试 着 联络 其 协调 程序 询问 该 事务 的 状态 。 如 果 无 法 询问 《其 协 调 程序 已经 
崩溃 或 者 网 络 被 分 割 )， 那 么 伴随 程序 可 以 试 着 联系 其 他 的 伴随 程序 。( 为 了 便于 实现 这 种 联 
系 ， 协 调 程序 可 以 在 其 准备 消息 中 提供 一 份 所 有 伴随 程序 的 清单 ， 伴 随 程 序 可 以 将 其 保存 在 
写 入 日 志 的 准备 记录 中 。) 如 果 伴 随 程序 发 现 还 有 其 他 的 伴随 程序 尚未 投票 ， 那 么 双方 都 可 以 


O ”值得 注意 的 是 ， 所 有 的 站 点 都 可 能 发 送 提交 消息 ， 可 是 在 超时 时 期 并 未 传递 过 该 消息 。 在 这 种 场合 ， 该 协 
调 程序 就 异常 中 止 该 事务 ， 哪 怕 共 所 有 伴随 程序 都 在 运行 ， 并 投票 提交 一 一 这 是 一 种 违背 直觉 的 状况 。 
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决定 异常 中 止 。 这 样 的 异常 中 止 决定 是 安全 的 ， 因 为 协调 程序 无 法 在 有 伴随 程序 尚未 投票 之 
前 决定 提交 。 如 果 它 发 现 某 伴随 程序 已 经 提交 或 异常 中 止 ， 它 也 可 以 做 出 同样 的 决定 。 如 果 
它 发 现 其 余 所 有 伴随 程序 都 处 在 不 确定 时 期 ， 那 么 它 将 继续 维持 阻塞 ， 直 到 能 够 建立 与 协调 
程序 或 某 个 提交 /异常 中 止 的 伴随 程序 的 联系 为 止 。 

4. 协调 程序 在 等 待 某 个 完毕 消息 时 超时 

协调 程序 与 请 求 完毕 消息 的 伴随 程序 联系 。 一 且 收 到 了 所 有 伴随 程序 的 完毕 消息 ， 它 就 
释放 其 事务 记录 。 

5. Bhi AE AP A 

当 协 调 程序 在 崩溃 后 再 重新 启动 时 ， 它 将 搜索 其 日 志 。 对 于 某 个 事务 T， 如 果 它 发 现 有 一 
条 提交 记录 但 没有 任何 结束 记录 ， 那 么 它 必 定 处 于 事务 T 的 协议 的 第 2 阶段 。 协 调 程序 就 把 
(在 f 的 提交 记录 中 找到 的 ) T 的 事务 记录 复原 到 易 失 型 存储 器 中 ， 并 向 其 所 有 伴随 程序 发 送 提 
交 消 息 来 继续 该 协议 ， 因为 该 协调 程序 可 能 在 发 送 提交 消息 之 前 已 崩溃 。 如 果 此 协调 程序 没 
有 发 现 某 事务 的 提交 记录 ， 那 么 存在 两 种 可 能 情况 : 

。 当 出 潢 发 生 时 ， 该 协议 仍 处 在 第 1 阶段 。 

。 其 协调 程序 已 经 异常 中 止 了 此 事务 。 

由 于 以 上 两 种 情况 下 协调 程序 都 没有 向 其 日 志 写 人 记录 ， 所 以 它 就 无 法 辨别 到 底 是 其 中 
的 哪 一 种 情况 。 幸 运 的 是 ， 协 调 程序 无 须 区 分 这 两 种 情况 ， 因 为 无 论 哪 种 情况 下 事务 都 已 异 
常 中 止 。 如 果 发 生 的 是 第 一 种 情况 ， 那 么 不 久 后 伴随 程序 就 会 向 其 协调 程序 询问 事务 的 状态 。 
因为 协调 程序 在 其 易 失 型 存储 器 中 找 不 到 此 事务 的 事务 记录 ， 它 就 会 回复 一 条 异常 中 止 消息 。 
这 是 允许 的 ， 因 为 当 协调 程序 崩溃 时 ， 事 务 仍 处 于 协议 的 第 1 阶段 ， 因 此 协调 程序 在 崩溃 前 还 
没有 来 得 及 做 出 任何 决定 。 下 面 要 介绍 的 预想 异常 中 止 协议 就 包含 了 这 部 分 的 原因 。 

6. 伴随 程序 在 准备 阶段 前 渍 或 超时 一 一 预想 的 异常 中 止 特性 

当 伴随 程序 在 崩溃 后 重启 动 时 ， 它 将 搜索 其 日 志 。 如 果 它 找到 的 是 一 条 准备 记录 ， 而 不 
是 提交 或 异常 中 止 记录 的 话 ， 它 就 知道 在 崩 读 发 生 时 它 正 处 于 准备 状态 。 它 就 会 向 协调 程序 
询问 该 事务 的 状态 。 协 调 程序 可 能 也 已 经 重新 启动 ， 或 者 在 伴随 程序 崩溃 时 ， 它 仍 是 活动 的 。 
如 果 协 调 程序 在 易 失 型 存储 器 中 找到 了 事务 的 事务 记录 ， 那 么 协调 程序 立即 可 以 回复 上 述 请 
求 。 然 而 ， 倘 车 它 没有 找到 事务 记录 ， 它 将 (不 去 查看 其 日 志 ) 假设 该 事务 已 经 异常 中 止 ， 
并 通知 伴随 程序 。 协议 的 这 种 特性 称 为 预想 的 异常 中 目 (presumed abort) [Mohan et al. 
1986]. 

预想 的 异常 中 止 特性 是 很 有 用 的 。 ， 因为 该 事务 记录 短缺 意味 着 下 述 情况 之 一 为 真 : 

。 协调 程序 已 经 提交 了 事务 ， 也 接收 到 了 所 有 伴随 程序 的 完毕 消息 ， 并 已 在 易 失 型 存储 器 

中 删除 了 事务 记录 。 

。 协 调 程序 已 崩溃 ， 而 它 的 重启 动 协议 则 在 其 日 志 中 发 现 了 该 事务 的 提交 记录 和 结束 

记录 。 

。 协 调 程序 异常 中 止 了 该 事务 ， 并 删除 了 事务 记录 。 

“协调 程序 已 崩溃 ， 而 它 的 重启 动 协议 在 其 日 志 中 确实 没有 发 现 事务 的 任何 记录 (CRS 

© 预想 (presume) 一 词 的 一 种 字典 定义 是 :“ 就 像 “ 预 想 是 清白 无 罪 的 ， 除 非 证 明 有 罪 ， 那 样 ， 将 希望 或 假 

定 当 作 可 能 是 真 的 "。 然 而 ， 在 本 场合 ， 该 协调 程序 一 定 知道 ， 该 事务 已 经 异常 中 止 。 
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中 止 过 该 事务 ， 或 者 当 协 调 程序 崩溃 时 处 于 协议 的 第 1 阶段 )。 

因为 伴随 程序 仍 处 于 准备 状态 (故而 没有 发 送 完 毕 消息 )， 前面 的 两 个 可 能 性 就 被 排除 了 。 
因此 ， 协 调 程序 就 可 以 报告 事务 已 异常 中 止 。 当 伴随 程序 在 其 准备 状态 下 超时 ， 并 向 协调 程 
序 询问 事务 状态 时 ， 此 原理 同样 适用 。( 注 意 ， 当 在 多 重 域内 使 用 此 提交 协议 时 ， 该 协议 树 里 
的 每 个 协调 程序 都 可 以 使 用 此 预想 的 异常 中 止 特性 ， 来 响应 其 伴随 程序 的 请 求 。 ) l 

7. 用 于 两 阶段 提交 协议 的 超时 协议 

TO1 伴随 程序 在 等 待 准备 消息 时 超时 。 该 伴随 程序 决定 异常 中 止 。 

TO2 协调 程序 在 等 待 投票 消息 时 超时 。 协 调 程序 决定 异常 中 止 ， 对 向 其 投票 就 绪 的 每 个 
伴随 程序 发 送 一 条 异常 中 止 消 息 ， 删 除 易 失 型 存储 器 中 的 事务 记录 ， 并 终止 参与 此 
协议 。 

TOS 伴随 程序 在 等 待 提交 /异常 中 止 消息 时 超时 。 伴 随 程序 试 着 与 其 协调 程序 通信 以 确 
定 事 务 的 结果 。 如 果 它 能 与 协调 程序 通信 ， 协 调 程序 就 会 运用 预想 的 异常 中 止 特 性 
来 产生 其 回答 。 倘 若 不 能 联系 与 协调 程序 通信 ， 它 将 试 着 与 其 他 伴随 程序 通信 。 如 
果 发 现 某 个 已 提交 或 异常 中 止 的 站 点 时 ， 它 将 做 出 同样 的 决定 。 倘 若 它 发 现 还 有 一 
个 站 点 没有 投票 ， 它 们 都 可 以 决定 异常 中 止 。 否 则 ， 此 伴随 程序 就 阻塞 。 

TO4 协调 程序 在 等 待 完成 消息 时 超时 。 协 调 程 序 向 请 求 发 送 完 毕 消息 的 伴随 程序 发 送 一 
条 消息 。 它 会 在 易 失 型 存储 器 中 维持 事务 记录 ， 直 到 接收 到 所 有 伴随 程序 的 完毕 消 
息 为 止 。 

这 个 在 一 次 崩溃 后 重启 动 协调 程序 或 伴随 程序 的 协议 ， 可 以 建立 在 25.2 节 所 描述 的 崩溃 恢 

复 过 程 上 面 。 
8. 用 于 两 阶段 提交 协议 的 重启 动 协议 
RES1 
如 果 重 启动 站 点 是 某 个 伴随 程序 站 点 ， 并 且 此 站 点 的 崩溃 恢复 过 程 在 其 日 志 中 发 现 了 某 
个 事务 的 异常 中 止 或 提交 记录 ， 那 么 这 个 事务 已 经 完成 ， 其 崩溃 恢复 过 程 也 不 会 采取 25.2 节 
已 讨论 过 的 行为 之 外 的 其 他 行为 。 

RES2 

如 果 该 重启 动 站 点 是 某 个 伴随 程序 站 点 ， 并 且 此 站 点 的 崩溃 恢复 过 程 在 其 日 志 中 发 现 了 
某 个 事务 的 事务 开始 记录 却 没 有 发 现 准 备 记 录 (因此 ， 此 伴随 程序 还 没有 投票 ) ， 那 么 其 崩溃 
恢复 过 程 也 不 会 采取 25.2 节 已 讨论 过 的 行为 之 外 的 其 他 行为 ( 即 ， 它 将 异常 中 止 该 子 事务 ) 。 

RES3 

如 果 该 重启 动 站 点 是 某 个 伴随 程序 站 点 ， 并 且 此 站 点 的 崩溃 恢复 过 程 在 其 日 志 中 发 现 了 

某 事务 的 准备 记录 却 没 有 发 现 提交 或 异常 中 止 记 录 (因此 ， 伴 随 程序 可 能 在 崩溃 之 前 就 已 经 
发 送 过 就 绪 投 票 )， 那 么 该 事务 是 在 伴随 程序 处 于 不 确定 时 期 时 崩溃 的 。 崩溃 恢复 程序 将 复原 
该 子 事务 所 作 的 全 部 数据 库 更 新 。 然后 伴随 程序 将 洲 循 协议 TO3。 

RES4 

如 果 重 启动 站 点 是 协调 程序 ， 并且 它 在 其 日 志 中 只 发 现 了 一 些 事 务 的 提交 记录 而 没有 发 

现 结束 记录 ， 那 么 此 崩溃 是 出 现在 协调 程序 提交 事务 之 后 ， 但 在 接收 到 所 有 伴随 程序 的 完毕 
消息 之 前 。 当 协调 程序 重启 动 后 ， 将 根据 提交 记录 把 事务 记录 复原 到 易 失 型 存储 器 里 。 然 后 ， 
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协调 程序 将 遵循 协议 TO4。 


26.2.3 格式 和 协议 : X/Open 标 准 


两 阶段 提交 协议 是 与 软件 模块 (如 由 不 同 厂商 提供 的 DBMS 和 事务 管理 程序 等 ) 联系 在 
一 起 的 。 如 果 这 些 模块 之 问 要 有 效 地 沟通 ， 或 应 用 程序 要 与 这 些 模块 沟通 的 话 ， 它 们 都 必须 
要 遵守 通信 约定 ， 有 时 称 为 格式 与 协议 (Format And Protocol，FAP)。FAP 的 标准 化 促进 了 
不 同 厂商 提供 的 产品 之 间 的 互 操作 性 (interoperability ) 。 

通过 定义 一 组 用 于 交换 协议 消息 的 函数 调用 以 及 这 些 消息 的 格式 ，X/Open 标 准 允 许 互 操 
作 性 。 利 用 X/Open 标准 、 由 事务 管理 程序 (协调 程序 ) 实现 并 由 事务 调用 的 函数 的 名 字 都 带 
有 前 缀 tx。 例 如 ， 图 26-3 里 启动 某 个 事务 所 调用 的 函数 是 tx_begin()。 类 似 地 ， 从 事务 管理 程 
序 到 资源 管理 器 所 调用 的 X/Open 函数 都 带 有 前 级 xa。 于 是 ， 当 资源 管理 器 (伴随 程序 ) 打算 
联结 到 某 个 事务 上 时 ， 它 调用 xa_regO0。 当 一 个 事务 打算 提交 时 ， 它 便 调用 txk_commitO)。 事 务 
管理 程序 通过 xa_prepare() 来 调用 每 个 资源 管理 器 (以 便 发 送 准备 消息 )， 并 等 待 着 此 函数 的 
返回 。 每 次 调用 xa_prepare0) 的 返回 值 便 是 资源 管理 器 的 就 绪 或 异常 中 止 投票 。 倘 车 所 有 的 投 
票 都 是 就 绪 ， 那 么 事务 管理 程序 就 设 定 调 用 tx_commitO 的 事务 程序 的 返回 值 为 提交 ， 并 通过 
”xa_commitO 调 用 每 个 资源 管理 器 。 如 果 有 一 个 或 多 个 xa_prepare() 的 返回 值 是 正在 异常 中 止 ， 
则 该 事务 管理 程序 就 设 定 该 事 务 调 用 tx_commit(O) 的 返回 值 为 异常 中 止 ， 并 通过 xa_abort() 调 用 
每 个 资源 管理 器 。 

X/Open 标准 提供 了 在 采用 RPC 方 式 调用 子 事务 的 情况 下 实现 全 局 型 原子 性 的 结构 。 例 如 ， 
在 本 例 场合 ， 剩 下 的 事情 就 是 调用 tx_begin 和 xa_reg。 


26.2.4 对 等 原子 提交 协议 


实现 事务 原子 提交 的 两 阶段 提交 协议 有 一 种 变 体 是 应 用 对 等 通信 ( 见 22.4.3 节 ) 。。 其 中 ， 
同步 点 管理 程序 执行 事务 管理 程序 的 作用 。 与 菜 应 用 程序 A 相关 联 的 同步 点 管理 程序 持 有 一 份 
记录 ， 记 载 着 A 能 与 之 直接 通信 的 所 有 应 用 程序 和 资源 管理 器 。 

假设 A 通过 声明 某 同 步 点 启动 了 该 协议 ， 那么 A 的 所 有 连接 必定 处 于 发 送 模式 。 与 A 相关 
联 的 同步 点 管理 程序 通过 向 A 所 调用 的 所 有 资源 管理 器 发 送 准 各 消息 并 向 A 连接 的 其 他 应 用 程 
序 发 送 同步 点 消息 开始 协议 的 第 1 阶段 。 然 后 ，A 处 于 等 待 状态 ， 直 到 该 协议 完成 为 止 。 当 同 
步 点 消息 到 达 另 一 个 程序 B 时 ， 该 程序 可 能 还 没有 完成 其 负责 的 事务 部 分 。 一 旦 它 完成 ， 而 且 
它 的 所 有 其 他 连接 (除了 连接 A 以 外 ) 也 都 处 于 发 送 模式 时 ， 它 便 同样 地 声明 一 个 同步 点 。 这 
将 导致 与 B 相 关联 的 同步 点 管理 程序 向 B 所 调用 的 所 有 资源 管理 器 发 送 准 各 消息， 并 向 与 B 通 
信 的 其 他 应 用 程序 (RALI) 发 送 同步 点 消息 。 然 后 ，B 处 于 等 待 状态 ， 直 到 该 协议 完成 为 
IE. 

同步 点 消息 就 以 这 种 方法 传播 ， 并 定义 出 与 图 26-4 类 似 的 一 种 树 结构 。 假 定 所 有 的 对 等 
点 都 希望 提交 ， 那 么 每 个 对 等 点 最 终 都 将 声明 一 个 同步 点 。 于 是 ， 所 有 的 点 都 在 其 同步 点 声 
明 处 实施 同步 ， 而 且 与 之 关联 的 资源 管理 器 也 处 于 准备 状态 。 投 村 就 结 消息 沿 着 该 树 自 下 向 
上 传播 ， 完 成 了 该 两 阶段 提交 协议 的 第 1 阶段 。 接 着 ， 第 2 阶段 开始 ， 该 事务 将 由 同步 点 管理 


日 ”此 处 的 描述 基于 [Maslak et al. 1991]。 
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程序 树 实施 提交 。 提 交 的 状态 也 会 返回 给 每 个 程序 ， 它 们 然后 就 可 以 启动 某 个 新 的 事务 来 继 
续 其 执行 过 程 。 

如 果 某 个 点 决定 异常 中 止 ， 那么 它 将 会 启动 局 部 的 回 退 ， 并 将 异常 中 止 状态 发 送 给 所 有 
的 资源 管理 器 ， 以 使 得 它们 也 回 退 。 此 异常 中 止 状 态 也 会 返回 给 每 个 程序 ， 这 些 程序 又 可 以 
再 启动 某 个 新 的 事务 来 继续 其 执行 过 程 。 


26.3 协调 的 传递 


一 般 说 来 ， 与 事务 启动 所 在 站 点 相关 联 的 事务 管理 程序 将 成 为 协调 程序 。 它 与 伴随 程序 
通信 ， 以 便 执行 原子 提交 协议 。 这 些 伴 随 程序 有 可 能 是 资源 管理 器 ， 但 它们 一 般 更 有 可 能 是 
某 个 分 布 式 事务 树 中 的 事务 管理 程序 。 

基于 启动 站 点 的 协调 ， 未 必 就 是 最 佳 的 做 法 ， 其 理由 如 下 。 第 一 ， 此 启动 站 点 可 能 并 非 
是 该 事务 中 最 可 靠 的 站 点 。 考 虑 到 该 事务 有 可 能 因为 某 个 POS 终 端的 某 些 操作 而 启动 ， 并 且 
还 可 能 涉及 到 该 商店 服务 器 及 客户 所 在 银行 的 服务 器 。 所 以 让 协调 位 于 这 些 服务 器 上 可 能 更 
安全 些 。 这 样 的 话 ， 可 以 修改 协议 ， 使 协调 程序 的 状态 从 一 个 参与 者 传递 到 另 一 个 参与 者 。 

协调 的 传递 的 第 二 个 原因 是 ， 应 当 对 必须 在 协议 中 交换 的 消息 的 数量 加 以 优化 。 带 有 预 
想 异 常 中 止 特 性 的 两 阶段 提交 协议 在 协调 程序 和 每 个 伴随 程序 之 间 一 般 交 换 四 条 消息 。 对 此 
进行 优化 是 有 可 能 的 。 例 如 ， 下 述 修改 协议 涉及 两 个 参与 者 P, 与 P,， 它 们 可 以 看 成 是 (控制 着 
一 组 伴随 程序 资源 管理 器 的 ) 事务 管理 程序 或 者 服务 器 。 

1) P, 进 入 难 备 状态 ， 从 而 开始 协议 (如果 P, 是 事务 管理 程序 ， 则 其 伴随 程序 全 都 处 于 准 
备 状态 )。 接 着 ， 它 向 P: 发 送 一 条 消息 ， 同 时 说 明 P, 已 准备 好 本 地 提交 ， 请 求 P: 准 备 并 整体 提 
交 该 事务 。 因 此 ， 该 消息 是 投票 就 绪 与 准备 消息 的 一 种 组 合 ， 并 把 协调 程序 的 角色 传递 给 P， 

2) P: 接 收 到 该 消息 ， 假 设 它 打算 提交 ， 则 进入 准备 状态 。 既 然 P; 知 道 P, 此 时 已 准备 ， 那 么 
P; 就 可 以 决定 整体 提交 该 事务 ， 并 采取 本 地 提交 该 事务 的 必要 操作 。 然 后 以 提交 消息 回应 Pi。 

3) P, 收 到 此 消息 后 ， 先 本 地 提交 ， 再 以 完毕 消息 回应 P;。 

由 于 预想 的 异常 中 止 特性 ， 该 完毕 消息 是 必 不 可 少 的 : 作为 新 协调 程序 的 P,， 必 须 能 够 
记得 该 事务 的 结果 ， 以 防 Pi 没有 收 到 提交 消息 的 情况 发 生 。 届 时 ， 它 就 能 够 回答 P, 对 于 该 事 
务 结果 的 询问 。 此 完毕 消息 指示 Ps:， 可 以 从 易 失 型 存储 器 中 删除 该 条 事务 记录 。 此 协议 只 交 
换 了 三 条 消息 (而 不 是 四 条 ) 就 完成 了 ， 这 一 事实 表明 ， 需 要 交换 的 消息 的 数量 是 能 够 进行 优 
化 的 。 


26.3.1 线性 提交 协议 


线性 提交 协议 (linear commit protocol) 是 一 种 采用 协调 传递 的 两 阶段 提交 协议 的 变形 。 
我 们 设想 伴随 程序 是 通过 某 条 (线性 ) 链 彼此 连接 的 。 不 妨 (任意 地 ) 假设 最 左 端 伴随 程序 
CI 启动 了 该 协议 。 一 旦 准备 好 提交 ， 它 就 将 进入 准备 状态 ， 并 向 其 右 侧 的 伴随 程序 C: 发 送 一 
条 消息 ， 表 明 其 已 准备 好 提交 ， 同 时 把 协调 传递 给 C:。 收 到 该 消息 后 ， 如 果 C2: 打 算 提 交 的 话 ， 
它 也 进入 准备 状态 ， 把 该 消息 转播 给 其 右 侧 的 伴随 程序 ， 并 再 一 次 传递 协调 。 这 样 的 过 程 一 
直 持 续 下 去 ， 直 到 该 消息 到 达 最 右 端 的 伴随 程序 C, 为 止 。 如 果 C, 同 意 提 交 ， 它 将 实施 提交 ， 
并 向 C,-: 发 送 一 条 提交 消息 。C,-: 又 再 提交 并 沿 着 此 链 传递 此 消息 ， 直 到 此 消息 到 达 C,) 为 止 ， 
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然后 C! 提 交 。 最 后 ， 一 条 完毕 消息 又 沿 着 此 链 从 Ci 传 到 C, 以 最 终 完成 此 协议 。 

在 收 到 第 一 个 协议 消息 后 ， 如 果 某 个 伴随 程序 决定 异常 中 止 事务 ， 则 事务 就 异常 中 止 ， 
并 将 异常 中 止 消息 发 送 给 其 左 侧 和 右 侧 的 伴随 程序 。 那 些 伴随 程序 也 异常 中 止 ， 并 将 异常 中 
止 消息 继续 沿 着 链 传播 直到 到 达 其 两 端 为 止 。 

用 来 在 发 生 各 种 故障 时 实现 原子 性 的 登录 、 超 时 和 恢复 协议 等 技术 与 两 阶段 提交 协议 中 
的 相应 技术 很 相似 〈 参 见 练 习 26.11 )。 

线性 提交 协议 比 两 阶段 提交 协议 包含 更 少 的 消息 ， 因 此 节约 了 通信 开销 。 假 设 有 n 个 伴随 
程序 ; 那么 线性 提交 仅 需 要 3(n-1) 条 消息 ,然而 两 阶段 提交 协议 则 需要 4n 条 消息 (并 涉及 一 
个 单独 的 协调 程序 )。 另 一 方面 ， 两 阶段 提交 只 需 经 过 4 次 消息 交换 即 可 完成 (与 伴随 程序 数 
目 励 关 )， 因 为 协调 程序 与 所 有 伴随 程序 的 通信 都 是 平行 的 。 可 是 线性 提交 却 需 要 3(n-1) 次 消 
息 交 换 才能 完成 ， 因 为 其 消息 是 串 行 发 送 的 。 

线性 提交 的 概念 我 们 将 在 第 27 章 讨论 的 因特网 事务 协议 中 介绍 。 


26.3.2 无 准备 状态 的 两 阶段 提交 协议 


可 以 用 协调 传递 的 基本 思想 来 调整 两 阶段 提交 协议 以 适应 下 述 情形 ， 其 中 (恰好 ) 有 某 个 伴 
随 程序 C 并 没有 领会 该 准备 消息 ， 因 而 也 没有 准备 状态 ( 当 C 是 老式 遗留 系统 时 ， 有 可 能 发 生 
这 种 情况 )。 在 这 种 情况 下 ， 协 调 程序 将 和 那些 支持 准备 状态 的 伴随 程序 一 起 按 通 常 的 方式 执 
行 此 协议 的 第 1 阶段 。 如 果 所 有 的 伴随 程序 都 赞成 提交 ， 那 么 该 协调 程序 将 向 C 发 送 一 条 提交 
消息 ， 此 消息 将 有 效 地 允许 C 来 决定 是 否 整 体 提交 该 事务 。 倘 车 C 向 该 协调 程序 响应 说 其 已 经 
提交 ， 那 么 该 协调 程序 将 向 其 他 伴随 程序 发 送 提交 消息 ， 并 完成 协议 的 第 2 阶段 。 倘 车 C 响 应 
说 它 已 经 异常 中 止 ， 那 么 该 协调 程序 将 向 其 他 伴随 程序 发 送 异 常 中 止 消 息 。 

值得 注意 的 是 ，C 实 际 上 确实 没有 协调 程序 的 功能 ， 因 为 它 并 没有 采取 处 理 故 障 的 必要 步 
又 。 它 既 不 维护 该 分 布 式 事务 的 事务 记录 ， 也 不 能 理解 完毕 消息 。 因 此 ， 它 无 法 响应 其 他 伴 
随 程序 的 是 否 发 生 故 障 的 询问 。 因 此 ， 协 调 没有 得 到 完全 的 传递 。 


26.4 分 布 式 死 锁 


使 用 等 待 的 翡 观 型 并 发 性 控制 易 发 生死 锁 。 假设 每 个 本 地 并 发 性 控制 都 不 允许 有 本 地 死 
锁 ， 我 们 期 望 确保 整个 系统 不 会 遭受 分 布 式 死 锁 (distributed deadlock)。 例 如 ， 在 站 点 A 和 B 
中 都 拥有 其 伴随 程序 的 两 个 分 布 式 事务 Ti 和 T: 之 间 ， 将 会 产生 一 种 简单 的 分 布 式 死 锁 。 若 在 A 
站 点 的 并 发 性 控制 使 得 Ti 的 伴随 程序 Ti 等 待 T 的 伴随 程序 Ts， 与 此 同时 ， 在 B 站 点 的 并 发 性 
控制 使 得 T: 的 伴随 程序 Ts 又 等 待 Ti 的 伴随 程序 Ts， 此 时 就 会 发 生死 锁 。 请 注意 ， 在 分 布 式 事 
务 的 一 般 模式 中 ， 伴 随 程序 是 允许 并 发 运行 的 ， 而 访问 单一 数据 库 的 事务 却 只 能 纯 串 行 地 进 
行 。 因此， 在 上 例 中 ，T2。 不 仅 持 有 Ti 所 等 待 的 资源 ， 而 且 由 于 它 并 没 因为 等 待 Tj 而 推迟 ， 
所 以 它 实际 上 还 能 够 运行 。 然 而 死 锁 仍然 将 出 现 ， 因 为 T, 不 能 在 其 全 局 化 提交 之 前 释放 锁 ， 
而 这 在 T2s 仍 在 等 待 的 情况 下 是 不 会 发 生 的 。 在 这 类 情况 下 ， 陷 入 死 锁 事 务 的 所 有 过 程 中 止 。 

一 般 说 来 ， 分 布 式 死 锁 是 无 法 通过 异常 中 止 或 重启 动 单个 的 伴随 程序 来 消除 的 。 某 个 伴 
随 程序 所 执行 的 语句 ， 实 际 上 是 该 事务 整体 所 执行 的 语句 的 一 个 子 序列 。 因 为 其 他 的 伴随 程 
序 可 能 已 经 执行 了 逻辑 上 在 这 些 子 序列 之 后 的 语句 ， 所 以 它们 就 不 能 再 重复 执行 。 例 如 ， 在 
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死 锁 发 生 之 前 ，Tis 计 算 的 结果 可 能 已 经 传输 给 了 Tis。 在 这 种 情况 下 ， 重 启动 TiA 但 不 同时 重 
启动 Tia 的 操作 是 毫 无 意义 的 ， 因 此 ， 整 个 分 布 式 事务 必须 重新 启动 。 

用 于 侦 测 分 布 式 死 锁 的 技术 是 23.4.2 节 讨论 的 技术 的 简单 延伸 。 其 一 ， 该 系统 将 建立 一 个 
分 布 式 的 waits_for 关 系 ， 并 搜索 是 否 存在 让 某 个 伴随 程序 等 待 的 循环 。 例 如 ，T': 的 伴随 程序 
通知 其 协调 程序 ， 它 正在 等 待 T: 的 某 个 伴随 程序 。T 的 协调 程序 则 随后 向 Tz 的 协调 程序 发 送 
一 条 探查 (probe) 消息 。 如 果 T, 的 协调 程序 收 到 过 其 某 个 伴随 程序 发 出 的 正在 等 待 T; 的 某 个 


伴随 程序 的 通知 ， 那 么 这 个 探查 消息 就 会 通过 T, 的 协调 程序 转送 给 T; 的 协调 程序 。 倘 若 该 探 


查 消 息 又 返回 到 了 T 的 协调 程序 处 ， 那 么 就 侦 测 到 了 一 个 死 锁 。 

其 二 是 使 用 超时 技术 。 一 旦 一 个 站 点 的 某 个 伴随 程序 的 等 待 时 间 超 过 了 某 一 阔 值 ， 则 此 
站 点 的 并 发 性 控制 就 认定 存在 死 锁 ， 并 异常 中 止 此 伴随 程序 。 

最 后 ， 将 23.4.2 节 所 描述 的 时 间 惟 技术 (timestamp technique) [Rosenkrantz et al. 1978] 稍 
加 推广 ， 也 可 以 应 用 到 分 布 式 事务 中 。 一 旦 启动 某 个 分 布 式 事务 ， 其 协调 程序 就 以 此 协调 程 
序 站 点 上 的 时 钟 作为 时 间 发 的 基础 。 为 了 确保 所 有 的 时 间 惟 都 是 全 局 型 唯一 的 ， 时 间 惟 是 通 
过 把 其 协调 程序 (唯一 的 ) 站 点 的 标识 符 添 加 到 时 钟 值 的 低位 上 而 形成 的 。 当 该 事务 在 一 个 
站 点 上 创建 了 某 个 伴随 程序 时 ， 它 将 同时 发 送 其 时 间 愉 的 值 。 由 于 分 布 式 事务 的 所 有 伴随 程 
序 都 使 用 单一 、 唯 一 的 时 间 改 ， 所 以 利用 不 允许 旧事 务 等 待 新 事务 的 策略 ， 就 能 够 消除 分 布 
式 死 锁 。 


26.5 全 局 可 串 行 化 


在 集中 式 系统 中 ， 并 发 控制 的 目标 是 响应 各 种 访问 数据 库 项 的 请 求 ， 以 便 产 生 某 个 特定 
的 隔离 级 别 。 在 一 个 分 布 式 事务 中 可 能 会 涉及 多 个 DBMS ， 而 各 个 DBMS 又 可 能 支持 不 同 的 隔 
离 级 别 。 在 这 样 的 情况 下 ， 我 们 就 只 能 很 粗略 地 定义 并 发 分 布 式 事务 之 间 的 隔离 级 别 。 然 而 ， 
现在 假定 我 们 需要 考虑 如 何 实现 全 局 可 串 行 化 调度 的 问题 。 最 简单 的 办 法 就 是 在 某 个 中 央 站 
点 提供 单一 控制 。 任 何 站 点 上 的 所 有 的 请 求 都 发 送 到 这 个 站 点 ， 此 站 点 维护 着 对 所 有 站 点 的 
数据 项 实现 加 锁 的 数据 库 结构 。 

这 样 的 系统 只 是 一 种 数据 为 分 布 式 的 集中 式 并 发 控制 系统 。 但 是 ， 这 种 简单 的 办 法 存在 
着 很 大 的 缺点 : 它 需 要 大 量 的 通信 (这 就 意味 着 会 带 来 延迟 ) ， 中 央 站 点 是 个 瓶颈 ， 和 而且 整 个 
系统 会 因为 中 央 站 点 的 故障 而 变 得 极其 脆弱 。 

另 一 种 更 好 的 、 常 用 的 办 法 是 ， 每 个 站 点 维持 其 本 地 的 并 发 控制 。 一 旦 一 个 (+) 事务 
在 某 些 站 点 请 求实 施 某 项 操作 ， 此 站 点 的 并 发 性 控制 则 并 不 与 其 他 任何 站 点 通信 ， 而 是 仅仅 
依据 本 地 可 利用 的 信息 做 出 决策 。 每 个 并 发 性 控制 都 分 别 地 运用 先前 所 描述 的 技术 来 确保 其 
所 产生 的 调度 至 少 等 价 于 其 站 点 上 的 全 局 事务 的 子 事务 和 事务 的 一 种 串 行 化 调度 。 该 系统 的 
总 体 设 计 必 须 确保 全 局 事务 是 全 局 串 行 化 的 ， 即 至 少 存在 一 个 所 有 站 点 都 赞成 的 、 等 价 的 串 
行 顺 序 。 i 

因为 站 点 独立 运行 ， 甚 至 有 可 能 使 用 不 同 的 并 发 性 控制 算 靶 ， 所 以 我 们 关心 的 是 是 否 存 
在 所 有 站 点 都 赞成 的 排序 .不妨 考 虑 在 A 站 点 和 B 站 点 中 都 拥有 伴随 程序 的 全 局 型 事务 Ti 和 T:。 
在 站 点 A，Tia 和 T>A 之 间 可 能 存在 冲突 操作 ， 而 按照 Ts，T2zA 的 顺序 是 可 串 行 的 ; 同时， 同样 
的 两 个 事务 在 站 点 B 的 操作 也 起 冲突 ， 而 按照 Ts，Tis 的 顺序 也 是 可 以 串 行 的 。 在 这 种 情况 下 ， 
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Ti 和 T: 之 间 总 体 上 不 存在 任何 等 价 的 串 行 调度 。 
我 们 可 以 肯定 ， 只 要 采用 个 别 的 并 发 控制 和 两 阶段 提交 协议 ， 每 个 站 点 的 本 地 可 串 行 性 
就 蓝 涵 着 全 局 型 可 串 行 性 。 特 别 地 ， 在 [Weihl 1984] 中 可 以 看 到 : 
如 果 每 个 站 点 的 并 发 性 控制 独立 地 使 用 严格 的 两 段 锁 或 采用 乐观 算法 ， 并 且 系 
统 使 用 某 种 两 阶段 提交 协议 ,那么 任何 全 局 调度 者 是 可 串 行 化 的 (按照 各 自 协调 程 
序 提交 它们 的 顺序 )。 
尽管 我 们 在 此 没有 证 明 结果 ， 但 不 难看 到 可 以 扩展 成 证 明 的 基本 论据 。 我 们 假设 A 站 点 和 
B 站 点 使 用 严格 的 两 阶段 加 锁 并 发 控制 ， 其 两 阶段 提交 算法 用 来 确保 全 局 原子 性 ， 事 务 T, 和 T; 
则 如 上 所 述 。 我 们 用 反 证 法 来 证 明 。 假 定 上 述 结论 不 正确 ( 即 这 些 事务 不 是 可 串 行 化 的 ) A 
且 两 个 事务 都 已 提交 。 假 设 在 A 站 点 的 某 个 数据 项 上 Ti 和 Tz 发 生 了 冲突 ， 于是， 在 Ti 释放 
Ab eal 
交 算 法 ， 所 以 Ts 要 到 Ti 提交 后 才 会 释放 该 锁 。 但 由 于 Ts 在 Tz 完 成 之 前 是 无 法 提交 的 ， 所 
DE AATE MIE 然而 ， 如 果 我 们 在 站 点 B 也 进行 同样 的 推理 ， 我 们 就 会 得 出 T 必 须 在 
Ti 之 前 提交 的 结论 。 因 此 ， 我 们 得 出 了 了 矛盾 的 结论 ， 于 是 两 个 事务 不 可 能 都 已 提交 。 事 实 上 ， 
我 们 在 站 点 A 和 站 点 B 上 所 假设 的 冲突 产生 了 一 个 死 锁 ， 因 此 必须 异常 中 止 其 中 的 某 个 事务 。 


26.6 不 能 保证 全 局 原子 性 的 场合 


在 实际 操作 中 ， 有 许多 原子 提交 协议 不 能 完成 的 场合 ， 因 此 也 无 法 保证 全 局 原子 性 。 
， 伴 随 程序 站 点 不 参与 两 阶段 提交 特定 的 站 点 可 能 不 支持 两 阶段 提交 协议 。 例 如 ， 某 个 
资源 管理 器 属于 遗留 系统 ， 该 遗留 系统 并 不 支持 准备 状态 。 另 外 ， 一 个 站 点 可 以 选择 不 
参与 ， 从 而 避免 因 阻塞 而 产生 的 性 能 降级 。 事 务 在 不 确定 时 期 里 是 受阻 塞 的 ， 并 且 -一 直 
持 有 锁 , 以 防止 其 他 事务 访问 已 锁定 的 数据 项 。 由 于 该 站 点 无 法 控制 不 确定 时 期 的 长 度 ， 
所 以 它 不 再 是 独立 的 ， 因 为 控制 对 加 锁 资源 访问 的 因素 是 受到 别处 控制 的 。 例 如 ， 不 确 
定时 期 的 长 短 取决 于 其 他 伴随 程序 对 准 各 消息 的 响应 速度 以 及 消息 传递 系统 的 效率 。 如 
果 该 协调 程序 崩溃 或 是 网 络 被 分 割 ， 那 么 伴随 程序 就 可 能 会 在 相当 长 的 一 段 时 间 里 持续 
阻塞 。 

选择 参与 协议 的 伴随 程序 站 点 常常 通过 单方 面 决定 提交 或 是 异常 中 止 某 个 受阻 塞 的 子 事 
务 来 释放 锁 ， 从 而 解决 这 样 的 问题 。 这 类 决策 称 为 启发 式 决策 (heuristic decision). 

但 是 ， 给 以 上 的 动作 指定 某 个 技术 性 的 名 称 并 不 能 改变 以 下 事实 : 此 动作 的 结果 可 能 会 
影响 全 局 原子 性 。 一 个 启发 式 决策 可 能 会 导致 该 数据 库 的 全 局 不 一 致 性 (在 某 站 点 上 更 新 数 
据 项 的 某 个 子 事务 可 能 提交 ， 而 同一 事务 在 另外 的 站 点 上 更 新 相关 数据 项 的 另 一 个 子 事务 就 
可 能 异常 中 止 )。 这 样 的 不 一 致 性 有 些 时 候 可 以 利用 即席 方式 ， 通 过 不 同 站 点 上 的 数据 库 管理 
员 之 间 的 通信 来 解决 。 虽 然 启发 式 决策 并 不 能 保证 全 局 原子 性 ， 但 是 它 是 解决 这 个 重要 的 实 

际 问题 的 唯一 方法 。 

伴随 程序 也 可 能 出 于 性 能 以 外 的 原因 而 不 参与 协议 。 例 如 ， 某 站 点 对 执行 子 事务 收费 ， 
当 该 子 事务 完成 并 将 结果 返回 给 应 用 程序 时 ， 哪 怕 整 个 事务 随后 异常 中 止 ， 此 站 点 仍然 会 要 
求 收费 。 为 此 ， 该 站 点 管理 员 可 能 坚持 该 子 事务 一 完成 后 就 马上 提交 ， 而 不 用 等 待 此 事务 在 
整体 上 是 提交 还 是 异常 中 止 。 
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。 语 言 不 支持 两 阶段 提交 。 在 应 用 程序 方面 ， BAIDBC, ODBCHKSRMANARK 
SQL 允 许 事务 连接 到 多 个 DBMS， 但 它们 并 不 支持 两 阶段 提交 。 当 一 个 事务 完成 时 ， 它 
一 次 一 条 地 向 每 个 DBMS 发 送 单个 的 提交 命令 。 这 样 ， 两 阶段 提交 协议 所 提供 的 all-or- 
none (全 部 或 没有 ) 提交 并 没有 得 到 强制 实施 ， 因 此 ， 其 事务 不 能 确保 全 局 原子 性 。 然 
而 ， 一 个 新 提议 的 包括 TP 监 控 器 (和 相应 的 API) 在 内 的 新 Java API 一 一 Java 事 务 服务 
(Java Transaction Service ，JTS ) ， 可 以 确保 采用 JDBC 的 分 布 式 事务 的 原子 化 提交 。 微 
软 也 推出 一 款 新 的 TP 监 控 器 一 微软 事务 服务 器 (Microsoft Transaction Server, MTS), 
其 中 包含 一 个 事务 管理 程序 (及 其 相应 的 API) ， 它 确保 采用 ODBC 的 分 布 式 事务 的 原子 
化 提交 。 此 外 ， 某 些 数据 库 厂 商 提供 的 内 嵌 式 SQL 在 该 厂商 生产 的 DBMS 中 〈 即 在 同 构 
系统 中 ) 支持 两 阶段 提交 。 

。 系 统 不 支持 两 阶段 提交 如果 要 求 支持 两 阶段 提交 协议 ， 就 需要 系统 中 间 件 包括 一 个 协 
调 程序 〈 事 务 管 理 程序 )， 而 且 要 求 应 用 程序 、 协 调 程序 和 服务 器 遵守 消息 交换 协定 。 
例如 ，X/Open 标 准 为 此 目的 而 专门 指定 了 API (如 区 和 xa 接 口 )。 对 于 许多 应 用 程序 来 说 ， 
这 样 的 系统 支持 是 无 法 提供 的 ， 所 以 两 阶段 提交 也 就 无 法 实现 了 。 


弱 提 交 协 议 


如 果 站 点 没有 参与 两 阶段 提交 协议 (或 某 个 其 他 的 原子 提交 协议 )， 那 么 分 布 式 事务 的 执 
行 就 无 法 保证 其 隔离 性 或 原子 性 。 尽 管 如 此 ， 设 计 系统 时 仍然 需要 遵守 这 种 约束 。 在 这 种 情 
况 下 ， 应 用 程序 的 设计 者 必须 仔细 地 评估 ， 此 约束 是 如 何 影响 该 数据 库 的 正确 性 ， 以 利于 客 
户 最 大 程度 地 使 用 该 应 用 程序 。 

在 不 支持 两 阶段 提交 时 ， 可 以 使 用 以 下 的 某 一 项 弱 提 交 协 议 ( weaker commit protocol). 

“ 在 一 阶段 提交 协议 (one-phase commit protocol) 中 ， 应 用 程序 在 其 所 有 的 子 事务 完成 

之 前 ， 并 不 向 任何 站 点 发 送 提交 命令 。 届 时 ， 它 再 向 其 访问 的 每 个 站 点 单独 地 发 送 提交 

命令 。 有 些 站 点 可 能 提交 ， 有 些 则 可 能 异常 中 止 。 用 JDBC 实 现 的 分 布 式 事务 就 能 够 以 

这 种 方式 运作 。 | 

* 在 零 阶段 提交 协议 (zero-phase commit protocol) 中 ， 每 个 子 事务 只 要 完成 在 某 站 点 中 

的 所 有 操作 ， 就 立即 提交 。 同 样 ， 有 些 站 点 可 能 会 提交 ， 有 些 则 可 能 异常 中 止 。 注 意 ， 

仅 当 子 事务 在 某 站 点 提交 后 ， 应 用 程序 才 可 以 在 其 他 的 站 点 启动 新 的 子 事务 。 在 这 类 协 

议 里 ， 应 用 程序 每 次 只 启动 一 个 子 事务 。 只 有 当 这 个 子 事务 完成 并 提交 后 ， 应 用 程序 才 

启动 另 一 个 子 事务 。 i 

“在 自动 提交 协议 (autocommit protocol) 中 ， 在 每 个 SQL 语句 之 后 立即 完成 一 次 提交 操 

fe (由 系统 自动 地 执行 )。 在 其 ODBC 或 JDBC 中 ， 自 动 提交 总 是 默认 的 。 

以 上 这 些 协 议 无 一 能 确保 全 局 原子 性 ， 因 为 子 事务 (或 操作 ) 有 可 能 在 某 些 站 点 提交 , 
但 在 另外 的 某 些 站 点 却 异 常 中 止 。 

在 所 有 的 子 事务 全 部 提交 的 正常 情况 下 ， 如 果 每 个 DBMS 都 使 用 严格 的 两 段 锁 算法 或 某 
个 乐观 型 并 发 控制 算法 ， 那 么 上 述 一 阶段 提交 协议 可 以 确保 全 局 可 串 行 性 。 

如 果 满足 以 下 三 个 条 件 : . 

1) 每 个 站 点 的 并 发 性 控制 者 独立 地 使 用 严格 的 两 段 锁 算法 或 乐观 型 算法 。 
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2) 应 用 程序 使 用 一 阶段 提交 协议 。 

3) 所 有 站 点 的 子 事务 都 提交 。 

那么 ， 所 有 的 全 局 调度 部 是 可 囊 行 化 的 (按照 应 用 程序 提交 此 事务 的 顺序 )。 
因此 ， 该 事务 维护 了 所 有 全 局 和 本 地 的 完整 性 约束 。 

根据 同样 的 推理 ， 通 过 增加 所 有 站 点 的 子 事务 都 必须 提交 这 一 约束 ， 我 们 可 以 证 明 这 里 
应 用 的 两 阶段 提交 有 类 似 的 结果 。 如 果 某 个 站 点 的 子 事务 异常 中 赴 ， 使 得 其 全 局 事务 无 法 保 
证 原子 性 ， 那 么 再 次 根据 同样 的 推理 可 知 ， 该 事务 中 已 提交 的 那 部 分 是 可 串 行 化 的 。 

采用 零 阶 段 协 议 ， 某 站 点 的 子 事务 在 启动 另 一 站 点 的 某 个 子 事务 并 请 求 锁 之 前 ， 可 以 提 
交 并 释放 其 站 点 上 的 锁 。 所 以 ， 从 全 局 观点 来 看 ， 即 便 所 有 站 点 的 子 事务 都 提交 ， 加 锁 也 不 
是 两 阶段 的 ， 因 此 全 局 可 串 行 性 也 得 不 到 保证 。 事 务 有 可 能 在 不 同 的 站 点 按 不 同 的 顺序 实现 
可 串 行 化 。 在 每 个 站 点 上 执行 的 子 事务 保持 其 本 地 完整 性 约束 ， 但 是 其 多 局 事务 则 未 必 能 保 
持 金 局 完整 性 约束 。 

零 阶段 提交 协议 持 锁 的 时 间 要 比 一 阶段 提交 协议 少 。 因 此 ， 它 可 以 提供 较 好 的 性 能 ， 但 
并 不 能 确保 全 局 可 串 行 化 。 因 此 ， 零 阶段 提交 协议 特别 适合 于 那些 没有 任何 全 局 完整 性 约束 
的 应 用 ， 所 以 多 局 型 可 串 行 性 也 不 成 问题 。 然 而 ， 本 地 可 串 行 性 还 是 应 当 保持 的 。 

自动 提交 协议 持 锁 的 时 间 最 短 ， 因 此 性 能 最 佳 。 但 是 ， 它 甚至 连 每 个 站 点 的 本 地 可 串 行 
性 都 无 法 保证 。 正 因为 这 个 原因 ， 无 论 是 全 局 完整 性 约束 还 是 本 地 完整 性 约束 ， 它 都 不 能 
确保 。 

在 一 阶段 提交 协议 和 零 阶 段 提 交 协 议 中 ， 如 果 其 应 用 程序 要 求 某 站 点 的 子 事务 提交 ， 但 
该 子 事务 反而 异常 中 止 的话 ， 该 应 用 程序 就 会 收 到 异常 中 止 的 通知 ， 并 有 可 能 采用 某 些 其 他 
方法 (或 许 通过 在 另外 的 站 点 启动 某 个 新 的 子 事务 ) 来 实现 预期 的 结果 。 对 于 某 些 应 用 程序 
来 说 ， 这 个 特点 与 两 阶段 提交 协议 相 比 具有 明显 的 优势 。 因 为 ， 在 两 阶段 提交 协议 中 ， 只 要 
任意 站 点 中 的 某 个 子 事务 异常 中 赴 的 话 ， 整 个 全 局 事务 也 就 异常 中 止 了 。 


26.7 复制 数据 库 


处 理 故 障 的 常用 技术 是 在 网 络 中 的 其 他 站 点 上 复制 每 个 数据 库 的 部 分 内 容 。 这 样 ， 如 果 
某 个 站 点 崩溃 或 者 由 于 分 割 而 与 网 络 分 开 ， 此 站 点 所 拥有 的 那 部 分 数据 库 仍然 可 以 通过 连接 
其 他 拥有 副本 的 站 点 来 访问 。 因 此 ， 数 据 的 可 用 性 (availability) 提高 了 。 

复制 也 可 以 提高 访问 数据 的 效率 (因此 增加 了 事务 吞吐 量 ， 减少 了 响应 时 间 )， 因 为 一 个 
事务 可 以 访问 存储 与 其 距离 最 近 的 (或 许 就 是 该 事务 启动 的 站 点 里 的 ) 副本 。 例 如 ， 在 18.2.3 
节 讨 论 过 的 因特网 食品 商 应 用 程序 里 ， 该 公司 拥有 一 张 描述 其 顾客 的 表 ，. 它 在 其 总 部 站 点 和 
交付 顾客 订单 的 本 地 仓库 站 点 里 都 有 副本 。 涉 及 商品 交付 的 事务 在 仓库 站 点 执行 ， 该 事务 使 
用 的 是 存储 在 仓库 站 点 的 副本 ; 而 每 月 向 所 有 顾客 发 送 邮件 的 事务 在 总 部 站 点 执行 ， 使 用 的 
是 存储 在 总 部 站 点 的 副本 。 

当然 ， 复 制 是 需要 代价 的 。 首 先 ， 需要 更 多 的 存储 空间 。 其 次 ， 因 为 我 们 需要 正确 地 安 
排 对 副本 数据 的 访问 ， 所 以 系统 变 得 更 加 复杂 了 。 例 如 ， 如 果 我 们 允许 两 个 事务 访问 ， 并 且 
它们 可 能 同时 更 新 闻 一 个 数据 项 的 不 同 副 本 ， 而 每 个 事务 可 能 都 不 知道 将 会 给 对 方 带 来 什么 
影响 ， 那 么 结果 就 会 产生 与 更 新 丢失 相 类 似 的 问题 。 因 此 ， 一 个 复制 系统 必须 要 确保 每 个 数 
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据 项 的 副本 都 能 正确 地 更 新 ， 并 且 向 请 求 读 取 那 些 数据 项 的 事务 提供 相应 的 值 。 在 因特网 食 
品 商 应 用 程序 中 ， 复 制 后 的 顾客 信息 只 需要 在 顾客 信息 变动 (例如 ， 地 址 改变 ， 但 这 不 经 党 
发 生 ) 后 更 新 即 可 。 

如 果 某 数据 项 的 副本 在 每 个 站 点 中 都 存在 ， 那 么 称 将 此 数据 项 完全 复制 (totally 
replicated ) 。 如 果 某 数据 项 的 副本 仅 在 部 分 而 不 是 全 部 站 点 中 存在 ， 那 么 称 将 此 数据 项 部 分 复 
制 (partially replicated ) 。 

如 果 DBMS 本 身 不 支持 复制 , 那么 应 用 程序 也 能 够 复制 数据 项 。 那 时 DBMS 将 不 会 意识 到 ， 
不 同 站 点 中 各 个 数据 项 其 实 互相 都 是 副本 。 如 果 xl1 和 x2 都 是 某 同 一 个 数据 项 的 副本 ， 那 么 很 
明显 ， 每 个 事务 都 必须 保持 完整 性 约束 xl = x2。 访 问 复制 数据 项 的 每 个 事务 必须 规定 它 需 要 
的 是 哪个 副本 。 更 新 复制 数据 项 的 事务 也 必须 明确 地 启动 子 事务 来 更 新 此 数据 项 的 每 个 副本 。 

绝 大 多 数 商用 DBMS 不 是 通过 事务 来 管理 复制 的 ， 而 是 为 管理 复制 提供 了 一 个 特别 的 子 
系统 一 一 副本 控制 ， 它 使 得 应 用 程序 无 法 看 到 复制 。 副 本 控制 知道 每 个 数据 项 的 所 有 副本 的 
位 置 。 当 某 个 事务 请 求 访问 数据 项 时 ， 它 并 不 指定 某 个 特定 的 副本 。 副 本 控制 自动 地 将 此 请 
求 翻译 成 访问 相应 的 副本 的 请 求 ， 并 将 该 请 求 传递 给 本 地 并 发 性 控制 (倘若 该 副本 在 本 地 站 
A) 或 (该 副本 驻 留 其 上 的 ) 远程 站 点 。 我 们 假设 该 并 发 性 控制 实施 某 个 加 锁 协议 ， 所 以 在 
访问 副本 时 ,仿佛 它们 采用 与 针对 普通 的 数据 项 一 样 的 方法 来 加 锁 , 即 读 取 访问 时 加 共享 锁 , 
写 入 访问 时 加 排他 锁 。 并 发 性 控制 并 不 知道 本 站 点 中 的 某 个 表 实际 上 是 另 一 个 站 点 的 另 一 个 
表 的 一 份 拷贝 。 图 26-5 显 示 了 副本 控制 与 并 发 性 控制 之 间 的 关系 。 


请 求 访问 x 的 远程 副本 “ 








请 求 访问 x 的 本 地 副本 


i eee NE Te 
is ere es 
“并 发 性 控制 。 
k ae : 
| 


访问 x 的 本 地 副本 


商用 DBMS 中 的 副本 控制 试图 维持 某 种 形式 的 相互 一 致 性 (mutual consistency), SAA 
一 致 性 (strong mutual consistency) 要 求 每 个 数据 项 的 任何 一 个 已 提交 副本 的 值 始终 要 与 其 
他 已 提交 副本 完全 相同 。 但 是 ， 考 虑 到 性 能 ， 这 个 目标 很 难 达到 。 因 此 ， 绝 大 多 数 的 副本 控 
制 采用 更 谨慎 的 目标 一 一 弱 相 互 一 致 性 (weak mutual consistency), ， 即 虽然 在 任意 的 特定 时 
间 里 ， 每 个 数据 项 的 所 有 已 提交 副本 可 能 会 具有 不 同 的 数值 ， 但 最 终 它们 将 会 具有 相同 的 值 。 
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我 们 可 以 使 用 很 多 算法 来 达成 这 个 目标 。 

最 简单 的 副本 控制 系统 称 为 单 读 / 全 写 系统 (read-one/write-all system )。 当 某 一 事务 请 求 
读 取 某 个 数据 项 时 ， 副 本 控制 可 能 返回 任意 一 个 副本 的 值 ， 不 妨 假设 是 最 近 的 副本 。 利 用 一 
个 完全 复制 的 系统 ， 没 有 更 新 复制 数据 项 的 事务 不 必 进 行 任何 远程 访问 ， 因 此 能 够 快速 地 响 
应 用 户 。 然 而 ， 当 一 个 事务 请 求 更 新 某 个 数据 项 ， 副 本 控制 就 必须 执行 某 种 最 终 可 以 更 新 此 
数据 项 的 所 有 副本 的 算法 。 这 是 一 种 相当 困难 的 情况 ， 不 同 的 算法 具有 不 同 的 特性 。 一 般 来 
说 ， 如 果 读 取 操 作 远 比 更 新 操作 频繁 的 话 ， 那 么 单 读 /全 写 系 统 将 会 改进 无 复制 系统 (其 中 ， 
读 取 可 能 需要 访问 远程 的 数据 项 ) 的 性 能 。 

根据 副本 控制 用 来 维持 相互 一 致 性 的 算法 ， 单 读 /全 写 系 统 能 够 被 刻画 为 同步 更 新 或 异步 
更 新 。 我 们 将 在 下 一 节 讨 论 同步 更 新 系统 ， 在 26.7.2 节 讨论 异步 更 新 系统 。 


26.7.1 同步 更 新 复制 系统 


在 同步 更 新 系统 ( synchronous-update system) 中 ， 当 一 个 事务 更 新 某 个 数据 项 时 ， 该 副 
本 控制 将 在 该 事务 提交 之 前 锁定 所 有 的 副本 并 予以 更 新 。 结 果 就 维护 了 强 形式 的 相互 一 致 性 。 
此 外 ， 因 为 副本 是 立即 更 新 的 ， 所 以 同步 复制 也 称 为 热切 (eager) 复制 。 当 事务 在 读 取 某 个 
数据 项 时 ， 仅 对 其 中 一 个 副本 加 锁 。 

假设 使 用 两 阶段 加 锁 策略 ， 在 该 事务 提交 之 前 ， 所 有 已 访问 的 副本 都 已 加 上 相应 的 锁 . 
因此 ， 事 务 可 以 串 行 执行 ， 而 数据 库 的 一 一 致 性 也 得 以 保持 。 

可 以 采取 以 下 两 种 形式 加 锁 : 

“悲观 型 ”在 事务 处 理 超出 访问 所 请 求 的 语句 之 前 ， 需 要 获得 所 有 必要 的 锁 。 

“乐观 型 ” 当 执 行 该 语 名 时， 只 锁 上 一 个 副本 ， 仅 当 其 访问 为 写 人 操作 时 才 实 施 更 新 。 其 

余 的 副本 则 仅 在 该 事务 提交 前 ， 才 加 锁 并 随后 再 更 新 。 

无 论 利 用 哪 种 形式 ， 都 有 可 能 产生 一 种 新 的 死 锁 类 型 一 一 单项 死 锁 (one-item deadlock). 
如 果 同 一 数据 项 的 两 个 更 新 程序 并 发 地 运行 ， 并 且 每 个 更 新 都 成 功 地 锁定 该 数据 项 的 副本 的 
某 个 子 集 ， 那 么 就 会 发 生 上 述 问 题 。 可 以 通过 常用 的 协议 来 解决 这 类 死 锁 。 

当 一 个 事务 提交 时 ， 我 们 必须 确保 同一 数据 项 的 每 次 更 新 都 是 永久 的 。 仅 在 该 事务 启动 
的 站 点 提交 此 事务 ， 并 向 副本 站 点 发 送 提交 消息 是 远 远 不 够 的 。 因 为 副本 站 点 A 可 能 在 收 到 此 
IBZ aT AR. ARES ial, 在 A 处 没有 安装 上 该 更 新 值 ， 那么 对 于 在 A 处 履行 的 另 一 个 
事务 所 提出 的 读 取 该 数据 项 的 请 求 就 不 能 返回 正确 的 值 。 

两 阶段 提交 协议 可 用 来 确保 如 果 事 务 提交 ， 则 每 个 副本 站 点 都 将 提交 其 新 的 值 。 伴 随 程 
序 就 是 该 事务 访问 过 的 副本 站 点 9。 虽然 没有 必要 为 每 个 伴随 程序 单独 评估 其 各 个 子 事务 的 
结果， 但 此 准备 状态 却 是 必需 的 ， 以 便 确保 在 该 事务 真正 提交 之 前 ,所 有 的 更 新 都 是 持久 的 。 

但 是 ， 热 切 复制 会 要 求 该 事务 获得 额外 的 锁 ， 这 就 增加 了 产生 死 锁 的 可 能 性 。 此 外 ， 由 
于 为 处 理 远程 副本 加 锁 请 求 所 需 的 时 间 ， 以 及 直到 所 有 的 副本 站 点 都 能 够 确保 持久 性 时 该 事 
务 才能 完成 的 这 一 事实 ， 其 响应 时 间 极 大 地 延长 了 。 这 些 因 素 影 响 了 性 能 ， 因 此 ， 同 步 复 制 
的 应 用 性 相当 有 限 。 


鲁 ” 仅 完成 读 取 操 作 的 副本 站 点 只 要 一 收 到 此 准备 消息 就 立即 放弃 其 读 取 锁 。 参 见 练习 26.14。 
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合议 庭 协议 

虽然 同步 更 新 单 读 /全 写 复制 可 以 为 读 取 者 增加 可 利 性 ， 但 它 对 更 新 者 是 没有 帮助 的 。 因 
为 一 个 (同步 型 ) 更 新 必须 访问 所 有 的 副本 ， 所 以 如 果 有 任何 站 点 崩溃 ， 则 其 更 新 就 无 法 完 
成 。 现 在 我 们 介绍 一 种 不 必 访 问 所 有 副本 的 同步 复制 ， 使 得 每 个 数据 项 仍 是 下 用 的 ， 即 使 革 
些 副 本 是 无 法 访问 的 。 为 了 达到 这 个 目标 ， 我 们 不 再 坚持 要 维护 相互 一 致 性 (即使 是 弱 相 互 
一 致 性 )。 因 为 副本 不 再 是 相同 的 ， 所 以 一 个 数据 项 的 状态 必须 按 其 副本 来 构筑 ， 而 副本 控制 
就 是 负责 这 个 任务 的 。 我 们 的 目标 与 单 读 /全 写 复制 一 样 : 所 有 通过 使 用 副本 控制 而 产生 的 调 
度 ， 都 应 当 与 每 个 数据 项 只 有 一 份 拷贝 时 的 可 串 行 化 调度 相同 。 

合议 庭 协 议 (Quorum Consensus Protocol) [Gifford 1979] 的 基本 思想 是 ， 当 一 个 事务 请 
求 读 取 (RSA) 某 个 复制 的 数据 项 时 ， 其 并 发 控制 在 批准 该 请 求 之 前 ， 首 先 对 那些 称 为 读 
取 法 官 (read quorum) 或 写 入 法 官 (write quorum) 的 子 集 加 锁 。 如 果 某 读 取 法 官 的 规模 是 
PP， 而 写 入 法 官 的 规模 是 4a， 那么 我 们 要 求 p+g>n 且 q>n/2， 其 中 是 副本 的 总 数 。 因 此 ， 我 们 
确保 在 任何 写 信 法官 和 读 取 法 官 之 间 、 某 特定 的 数据 项 的 任何 两 个 写 人 法 官 之 间 存 在 某 个 非 
空 交 集 。 其 结果 是 ， 每 当 并 发 事务 执行 某 个 复制 的 数据 项 有 冲突 的 操作 时 ， 在 至 少 有 一 个 副 
本 的 站 点 上 ， 是 不 会 批准 加 锁 请 求 的 ， 因 此， 其 中 的 某 一 个 操作 将 被 迫 等 待 。 值 得 注意 的 是 ， 
单 读 /全 写 系 统 可 以 看 成 是 一 种 合议 庭 协议 ， 其 中 读 取 法 官 的 副本 数 为 1， 写 入 法 官 的 副本 数 
An. f - 
合议 庭 协 议 使 得 我 们 可 以 权衡 可 用 性 和 在 某 个 数据 项 上 的 操作 代价 。z 的 值 越 小 ， 读 取 的 
数据 项 的 可 用 性 就 越 高 ， 读 取代 价 也 越 低 。 同 样 地 ，3 的 值 越 小 ， 写 人 的 数据 项 的 可 用 性 就 越 
强 ， 写 人 代价 也 越 低 。 然 而 ， 读 写 的 可 用 性 是 彼此 相关 的 。 读 取 的 可 用 性 与 效率 越 高 ， 那 么 
写 入 的 可 利用 性 与 效率 就 越 低 。 

. 当 某 个 写 入 要 求 得 到 批准 (因此 该 事务 提交 ) 时 ， 仅 有 写 人 法官 中 的 数据 项 得 以 更 新 。 

因此 ， 没 有 保持 相互 一 致 性 ， 在 不 同 站 点 的 副本 可 能 有 不 同 的 值 。 我 们 假设 ， 每 当 事 务 提交 
时 ， 就 为 它 分 配 一 个 唯一 的 时 间 惟 ， 而 每 个 数据 项 的 所 有 副本 都 包含 着 最 后 写 人 此 副本 的 
(已 提交 ) 事务 的 时 间 截 。 因 为 每 个 读 取 法 官 都 与 写 入 法 官 相交 ， 所 以 读 取 法 官 与 最 近 写 入 的 
写 人 法 官 相交 。 因 此 ， 每 个 读 取 法 官 中 至 少 有 一 个 数据 项 拥有 最 后 更 新 此 数据 项 的 事务 的 时 
间 戳 ， 从 而 拥有 当前 值 。 此 时 间 改 是 法 官 中 的 最 大 时 间 脾 。 副 本 控制 向 读 取 请 求 返回 相应 的 
副本 的 值 。 

我 们 现在 总 结 一 下 合议 庭 协议 。 我 们 假设 某 个 数据 项 R 在 该 系统 中 存储 为 一 系列 的 副本 ， 
每 个 副本 包含 有 一 个 值 及 一 个 时 间 惟 。 我 们 还 假设 采用 某 个 直接 更 新 的 悲观 型 并 发 性 控制 以 
及 某 个 严格 的 两 阶段 提交 协议 。 最 后 ， 我 们 假设 每 个 站 点 维护 一 个 本 地 时 钟 ， 而 且 该 时 钟 至 
少 被 同步 到 事务 的 时 间 惟 与 其 提交 顺序 是 相 一 致 的 。 

合议 庭 副 本 控制 协议 

1) 当 在 A 站 点 中 执行 的 一 个 事务 发 出 读 取 / 写 人 某 个 特定 数据 项 的 请 求 时 ，A 站 点 的 副本 
控制 会 把 此 项 请 求 发 送 给 包含 其 副本 的 站 点 的 读 取 / 写 人 人 法官。 如果 该 副本 站 点 的 并 发 控制 批 
准 给 该 副本 加 上 相应 的 锁 的 话 , 那么 该 请 求 操作 得 到 实施 , 并 将 应 答 返 回 给 A 站 点 的 副本 控制 。 
若是 读 取 请 求 ， 那 么 此 应 答 将 包含 该 副本 的 值 及 其 时 间 蕉 。 

2) 一 且 A 的 副本 控制 收 到 某 个 站 点 法 官 的 应 答 ， 该 事务 便 继续 推进 。 如 果 是 读 取 请 求 ， 
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副本 控制 就 把 拥有 最 大 时 间 改 的 副本 值 返回 给 此 事务 。 

3) 事务 通过 两 阶段 提交 协议 实施 提交 ， 其 中 伴随 程序 是 持 有 读 / 写 锁 的 所 有 站 点 。 协 调 
程序 为 那些 采用 本 地 时 钟 的 事务 获取 时 间 惟 ， 并 将 它 和 准备 消息 一 起 发 送 。 如 果 该 事务 提交 ， 
那么 有 写 人 动作 的 每 个 伴随 程序 在 更 新 其 副本 时 ， 都 将 采用 在 其 解锁 以 前 的 时 间 戳 值 。 

只 要 控制 程序 可 以 为 所 有 的 操作 集中 必要 的 法 官 ， 那 么 即便 出 现 故 障 ， 该 协议 仍然 可 以 
进行 。 当 某 个 站 点 故障 ， 并 随后 重启 动 时 ， 它 的 某 些 副本 可 能 会 持 有 非常 早 的 时 间 改 。 然 而 ， 
该 站 点 无 须 采取 任何 特别 的 恢复 动作 ， 因 为 在 没有 被 后 来 的 事务 覆盖 之 前 ， 这 些 副 本 是 不 会 
被 任何 事务 使 用 的 ， 而 一 旦 覆盖 ， 这 些 值 就 是 当前 值 了 。 


26.7.2 异步 更 新 复制 系统 


在 异步 更 新 系统 (asynchronous-update system) 中 ， 当 事务 更 新 某 个 数据 项 时 ， 副 本 控 
制 在 该 事务 提交 之 前 仅仅 更 新 部 分 而 不 是 全 部 的 副本 。 最 常见 的 是 仅仅 更 新 一 个 副本 。 其 余 
的 副本 将 在 该 事务 提交 后 才 更 新 。 因 此 ， 只 能 保持 弱 相 互 -一 致 性 。 这 些 更 新 可 以 由 提交 操作 
而 触发 ， 或 是 以 固定 的 时 间 间隔 周期 性 地 执行 的 。 由 于 副本 并 没有 立即 更 新 ， 所 以 异步 复制 
又 称 为 情 性 (lazy) 复制 。 更 新 并 不 是 作为 事务 本 身 的 一 部 分 来 完成 的 ， 所 以 系统 整体 上 可 能 
不 是 可 串 行 化 的 ， 并 且 事 务 可 能 会 看 到 某 种 不 一 致 的 状态 。 

例如 ， 图 26-6 显 示 的 是 一 个 调度 ， 其 中 事务 Ti 更 新 za (x 在 A 站 点 的 拷贝 ) 和 ys (y 在 B 站 点 
的 拷贝 )。 在 Ti 提交 后 ， 事 务 T; 读 取 ye (因此 得 到 了 y 的 新 值 ) 和 站 点 C 中 的 x 的 副本 xc (尚未 来 
得 及 更 新 )。 因 此 ，T: 将 (可 能 ) 看 到 该 数据 库 的 不 一 致 视图 。 然 后， 将 执行 菜 个 副本 更 新 事 
务 T,, 来 更 新 x*、y 以 及 xc 的 所 有 副本 。 


Tii w(x) w(ys) 提交 
Tz: r(xc) 


T3: 





图 26-6 显示 采用 惰性 复制 可 能 会 出 现 不 一 致 的 调度 的 例子 。 了 更 新 站 点 A 和 B 的 zx 和 y。T- 在 T: 
提交 后 传播 该 更 新 。 由 于 传播 是 异步 的 ， 所 以 T, 看 到 的 y 是 新 值 ， 但 x 却 是 旧 值 


在 复制 场合 ， 捕 效 (capture) 是 指 副 本 控制 确定 某 个 应 用 程序 的 副本 的 更 新 已 经 出 现 ， 
”并 需要 将 此 更 新 传播 到 其 他 的 副本 的 过 程 。 捕获 可 以 采取 两 种 形式 : 监视 日 志 并 密切 注意 对 
于 复制 的 数据 项 的 更 新 ， 供 以 后 传播 之 用 ; 在 数据 库 中 设置 触发 器 ， 以 记录 变更 。 应 用 
(apply) 是 指 通知 副本 站 点 必须 实施 该 更 新 ， 以 确保 它们 的 副本 是 当前 最 新 的 过 程 。 

不 同形 式 的 异步 复制 适合 不 同 的 应 用 程序 。 在 某 些 情况 下 ， 重 点 需要 放 在 使 副本 尽 可 能 
紧密 的 同步 。 虽 然 并 不 保证 可 串 行 化 ， 但 我 们 的 目标 是 尽量 减少 从 一 个 副本 更 新 到 将 此 更 新 
应 用 到 其 他 副本 之 间 的 时 间 间 隔 。 维 护 账户 或 客户 服务 记录 的 分 布 式 应 用 程序 就 属于 这 个 范 
畴 ， 它 们 有 着 各 种 名 称 : 成 组 (group) MH. WE (peer-to-peer) 复制 、 多 主 (multi-master) 
复制 。 在 其 他 的 情况 下 ， 紧 密 的 同步 性 并 不 是 最 重要 的 。 例 如 ， 某 公司 在 该 领域 拥有 巨大 的 
销售 能 力 ， 但 它 只 需 周期 性 地 登录 主 站 点 ， 并 下 载 最 新 的 数据 视图 ， 就 能 满足 其 需要 了 。 在 


O ”如 前 所 述 ， 仅 仅 实施 读 取 操作 的 副本 站 点 只 要 一 收 到 准备 消息 ， 就 能 够 立即 放弃 其 读 取 锁 。 
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这 种 情况 下 经 常 使 用 的 复制 形式 是 主持 贝 复 制 (primary copy replication )。 当 大 批量 的 数据 必 
须 更 新 时 ， 往 往 应 用 第 三 种 复制 形式 ， 即 所 谓 过 程式 (procedural) 复制 。 

1. 主 拷贝 复制 

数据 项 的 某 个 特定 的 副本 可 以 指定 为 主 拷贝 (Primary copy) [Stonebraker 1979]， 其 余 的 
副本 都 是 次 拷贝 (secondary copy)。 次 拷贝 通过 订阅 (subscribing) 主 拷贝 所 做 的 变更 而 产生 。 
虽然 事务 可 以 读 取 任意 的 拷贝 ,但 它 只 能 更 新 主 找 贝 。 如 果 在 A 站 点 的 事务 T 希 望 更 新 数据 项 
Xx， 一 种 办 法 是 在 x 的 主 找 贝 x, 上 设置 一 个 排他 锁 ， 然 后 再 更 新 这 个 主 找 贝 。 哪 怕 在 A 站 点 有 次 
拷贝 xie， 也 不 会 去 更 新 这 个 次 拷贝 。 其 结果 是 ， 若 有 两 个 事务 要 更 新 xz，z 上 的 锁 也 只 能 等 到 
第 一 个 事务 提交 后 才能 授予 第 二 个 事务 。 因 此 ， 事 务 的 写 人 操作 是 串 行 化 的 ， 但 读 取 操 作 却 
不 是 。 另 一 种 办 法 是 ， 应 用 程序 只 需要 把 更 新 传递 给 主 拷贝 ， 以 便 稍 后 再 处 理 。 

当 T 提 交 后 ，T 的 更 新 将 异步 地 、 非 串 行 化 地 传播 给 次 拷贝 (包括 za)。 因 为 T 和 应 用 步 又 
没有 设立 单一 的 隔离 级 单位 ， 所 以 副本 是 以 非 串 行 化 方式 更 新 的 。 对 于 读 取 来 说 ， 使 用 任意 
的 副本 都 可 以 满足 ， 因 此 ， 并 发 性 事务 有 可 能 看 到 该 数据 库 的 某 个 不 一 致 的 视图 (如 图 26-6 
所 示 )， 结 果 造 成 功能 的 不 正确 。 

利用 主 拷贝 复制 ， 所 有 的 更 新 都 通过 主 拷贝 汇集 起 来 ， 此 拷贝 所 在 的 站 点 然后 执行 副本 
更 新 事务 ， 以 实现 其 应 用 步骤 。 某 个 更 新 事务 可 以 更 新 所 有 的 副本 (如 图 26-6 所 示 )， 或 者 每 
个 副本 都 需要 使 用 单独 的 更 新 事务 。 如 果 每 个 副本 的 更 新 事务 都 是 按照 主 拷贝 的 更 新 顺序 可 
串 行 化 地 执行 ， 那 么 该 副本 控制 系统 就 能 够 确保 : 每 个 次 拷贝 都 可 以 按照 主 拷贝 的 顺序 看 到 
该 更 新 。 这 就 确保 了 弱 相 互 一 致 性 。 

在 主 拷贝 复制 的 某 些 方案 中 ， 如 果 站 点 A 的 T 请 求 更 新 xz， 且 xm 不 是 主 拷贝 ， 那 么 它 将 对 x 
的 主 拷贝 和 xx 两 者 都 加 锁 ， 并 把 对 它们 的 更 新 作为 该 事务 的 一 部 分 。 其 余 的 次 拷贝 将 如 前 所 
述 ， 在 T 提 交 以 后 再 更 新 。 采 用 这 种 方法 ， 在 A 站 点 的 用 户 就 可 以 直接 执行 随后 的 、 需 要 读 取 
Xx4 的 事务 ， 而 不 必 等 待 从 主 拷贝 处 向 A 传播 回访 更 新 。 

采用 主 拷贝 复制 实现 应 用 步 又 的 另 一 个 办 法 是 ， 副 本 控制 系统 可 以 周期 性 地 向 所 有 次 拷 
Wy (broadcast) 主 拷贝 的 当前 值 ， 而 不 是 在 事务 完成 后 再 传播 其 主 拷贝 的 更 新 。 这 种 值 
广播 应 当 在 事务 上 是 一 致 的 ， 它 包含 着 自从 上 次 广播 以 来 由 已 提交 事务 所 完成 的 全 部 更 新 。 

在 有 些 实现 中 ， 每 个 次 站 点 可 以 声明 主 数 据 项 的 某 个 视图 ， 并 且 仅 仅 传递 此 视图 。 若 次 
站 点 与 主 站 点 之 间 是 利用 低 带宽 (例如 电话 ) 来 通信 的 ， 那 么 每 个 站 点 仅仅 复制 那些 相关 的 
数据 就 显得 很 重要 ， 此 时 利用 这 个 方法 就 很 重要 。 

还 有 一 些 实现 应 用 步骤 的 办 法 ， 其 更 新 并 不 是 自动 地 从 主 站 点 传播 的 ， 而 是 由 副本 站 点 
明确 地 请 求 刷新 他 们 的 视图 。 这 被 称 作 上 拉 策 略 (pull strategy ) ， 因 为 次 站 点 是 从 主 站 点 拉 取 
这 些 数 据 。 相 反 地 ， 在 我 们 以 前 所 描述 的 下 推 策略 (push strategy) 算 革 中， 主 站 点 是 将 数据 
向 下 推 给 次 站 点 。 下 推 策 略 缩小 了 副本 值 可 能 不 一 致 的 时 间 间 隔 。 无 论 使 用 哪 种 策略 ， 一 个 
数据 项 的 所 有 副本 最 终 都 会 包含 同样 的 值 ， 所 以 弱 相 互 一 致 性 得 到 支持 。 

当 次 站 点 是 该 地 区 的 某 个 大 型 销售 团队 使 用 的 移动 (可 能 是 手提 的 ) 电脑 时 ， 利 用 下 推 
策略 可 能 是 很 合适 的 。 每 个 销售 人 员 可 以 在 连接 到 网 络 时 更 新 他 的 数据 项 的 副本 。 因 为 带宽 
较 窗 ， 他 就 可 以 定义 一 个 仅仅 包含 与 其 销售 地 区 相关 的 信息 的 视图 。 在 这 样 的 应 用 程序 中 ， 
副本 可 以 稍为 陈旧 些 ( 例 如 灌 后 几 分 钟 或 几 小 时 )。 读 取 访 问 占 大 多 数 。 只 有 在 签署 新 的 合约 
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时 ， 该 新 信息 首先 发 送 到 主 站 点 ， 而 后 再 传播 到 (或 是 被 上 拉 到 ) 所 有 的 次 站 点 ， 这 时 才 可 
能 会 出 现 写 和 访问。 倘若 更 新 出 现时 次 站 点 是 断 开 的 ， 那 么 此 更 新 就 必须 保持 到 建立 起 某 个 
新 的 连接 为 止 。 

2. 成 组 复制 

对 于 任何 复制 品 (不 妨 假设 是 最 近 的 副本 ) 都 可 以 实施 更 新 。( 因 此 ， 如 果 数 据 库 是 完 
全 复制 的 ， 那 么 仅 利用 本 地 站 点 的 数据 就 能 够 完成 读 / 写 事务 或 只 读 事务 。) 某 个 事务 T 所 作 
的 更 新 ， 将 在 以 后 才 传 播 给 其 他 的 副本 ， 由 于 传播 是 异步 的 ， 所 以 全 局 可 串 行 化 无 法 得 到 
保证 。 

和 使 用 主 拷贝 复 制 一 样 ,， 成 组 复制 可 能 会 导致 非 串 行 化 (从 而 引起 不 正确 的 ) 调度 。 例 如 ， 
有 可 能 出 现 与 图 26-6 相 似 的 调度 。 此 外 ， 如 果 没 有 进一步 的 改进 ， 可 能 过 弱 相 互 一 致 性 都 无 法 
保持 。 图 26-7 说 明了 在 站 点 A 和 D 执 行 的 两 个 并 发 性 事务 Ti 和 T: 分 别 更 新 数据 项 * 的 不 同 的 副本 
的 情况 。 如 图 所 示 ， 传 播 这 些 更 新 的 消息 的 到 达 顺 序 在 不 同 的 副本 站 点 是 不 一 样 的 。 由 于 副 
本 的 最 终 值 是 其 最 后 一 次 写 人 的 值 ， 所 以 车 副本 是 按 不 同 的 顺序 更 新 的 ， 那 么 就 无 法 保持 相 
互 一 致 性 。 按 复制 的 术语 来 说 ， 就 是 出 现 了 某 个 冲突 (conflict) ， 因 此 副本 控制 系统 必须 采用 
冲突 化 解 策略 (conflict resolution strategy) 来 保证 收敛 性 (convergence ) 和 相互 一 致 性 。 


站 点 A 站 点 B 站 点 C 站 点 D 


T, T: 


更 新 x 更 新 x 
发 送 更 新 消息 发 送 更 新 消息 
时 间 








图 26-7 采用 成 组 复制 ， 更 新 可 能 以 不 同 的 顺序 到 达 副 本 ， 从 而 使 相互 一 致 性 遭 到 破坏 


一 种 保证 弱 相 互 一 致 性 的 算法 是 给 每 个 更 新 和 每 个 副本 都 加 上 唯一 的 时 间 惟 。 所 谓 更 新 
的 时 间 惟 就 是 将 更 新 提交 给 系统 的 时 刻 ， 复制 品 的 时 间 惟 是 其 上 应 用 的 最 近 一 次 更 新 的 时 间 
B. KOA ASHE A REE RE FEA BAG A TOE, ABZ, ET 
弱 相 互 一 致 性 。 这 是 我 们 在 23.8.1 节 中 讨论 的 托马斯 号 入 规则 (Thomas Write Rule)[Thomas 
1979] 的 一 个 例子 。 采 用 这 种 算法 ， 每 个 副本 的 值 最 终 将 收敛 到 时 间 惟 最 大 的 (最 新 的 ) 那 些 更 
新 的 值 。 虽 然 此 规则 保证 了 弱 相 互 一 致 性 ,但 有 可 能 会 丢失 更 新 ， 因 为 两 个 事务 读 取 并 更 新 
了 不 同 的 副本 ， 然 而 只 留 下 了 其 中 一 个 的 结果 。 因 此 ， 这 种 算法 可 能 不 适合 于 某 些 应 用 程序 。 

遗憾 的 是 ， 在 这 种 情况 下 ， 不 存在 一 个 可 以 为 所 有 的 应 用 程序 正确 地 融合 不 同事 务 效果 的 
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算法。 在 某 些 应 用 程序 中 ， 明 显 地 存在 合适 的 冲突 化 解 策略 。 例 如 ， 如 果 一 个 目录 已 复制 好 ， 
而 且 并 发 事务 向 不 同 的 副本 分 别 追 加 了 不 同 的 条 目 ， 那 么 最 终 目 录 中 的 所 有 副本 都 包含 这 些 
条 目 。 这 样 的 话 ， 我 们 就 可 以 为 某 一 特定 应 用 程序 设计 一 种 冲突 化 解 策略 。 在 一 般 情况 下 ， 
每 当 副 本 控制 系统 侦 测 到 冲突 时 ， 它 就 会 通知 用 户 并 人 允许 用 户 来 化 解 冲 突 。 因 为 没有 任何 冲 
突 化 解 策略 可 以 确保 始终 正确 ， 所 以 某 些 商用 系统 就 提供 了 一 些 可 供 选 择 的 即席 策略 ， 包 括 
“最 里 更 新 赢 "、“ 最 新 更 新 赢 "~、“ 最 高 优先 级 站 点 赢 ” 和 “用 户 提供 的 冲突 化 解 过 程 ”等 。 

3. 过 程 复制 

当 更 新 需要 以 面向 批 处 理 方 式 应 用 到 许多 数据 项 时 (如 在 每 个 银行 账户 中 加 入 利息 ， 以 
及 在 多 个 站 点 中 复制 银行 记录 )， 使 用 这 种 复制 形式 是 很 有 用 处 的 。 如 果 每 个 更 新 是 在 网 络 中 
单独 传递 的 话 ， 通 信 成 本 会 较 高 。 一 种 可 供 选 择 的 方法 是 在 每 个 次 站 点 上 都 复制 一 个 存储 过 
程 ， 一 旦 该 数据 需要 更 新 时 ， 便 在 所 有 的 副本 上 调用 此 过 程 。 

4. 小 结 

同步 更 新 系统 与 异步 更 新 系统 之 间 的 权衡 就 是 正确 性 与 性 能 的 一 种 对 全 。 许 多 商用 
DBMS 提 供 了 这 两 种 类 型 的 复制 。 设 计 者 应 当 清 楚 ， 异 步 更 新 有 可 能 会 产生 不 正确 的 、 非 串 
行 化 调度 ， 并 导致 不 一 致 的 数据 库 。 


26.8 现实 世界 里 的 分 布 式 事务 


虽然 分 布 式 事务 处 理 系 统 的 设计 理论 看 上 去 较 复杂 ， 但 最 终 运 行 结果 却 出 平 意料 的 简单 
且 很 实用 。 如 果 每 个 站 点 的 并 发 性 控制 是 严格 的 两 阶段 悲观 型 加 锁 控 制 或 乐观 型 控制 ， 并 使 
用 两 阶段 提交 协议 来 保证 提交 时 伴随 程序 同步 ， 那 么 分 布 式 事务 将 是 可 申 行 化 的 。 全 局 死 锁 
是 由 于 悲观 型 控制 所 强制 的 等 待 造成 的 ， 但 可 以 通过 时 间 虐 、 等 待 图 或 者 超时 来 解决 。 

这 种 简化 的 结果 是 ， 拥 有 着 不 同 厂商 生产 的 DBMS 的 互 连 站 点 也 可 以 实现 分 布 式 事务 处 
理 系 统 ， 但 必须 满足 如 下 的 条 件 : 

1) 所 有 的 DBMS 实 现 两 个 指定 的 并 发 控制 之 一 。 

2) 每 个 站 点 都 要 参与 此 两 阶段 提交 协议 。 

这 些 想法 大 大 地 简化 了 系统 设计 。 

原子 性 和 隔离 性 是 事务 处 理 系统 的 特点 ， 这 种 事务 处 理 系统 确保 只 要 应 用 程序 的 事务 是 
一 致 的 ， 那 么 此 应 用 程序 就 能 正确 地 执行 。 我 们 已 经 看 到 ， 许 多 分 布 式 事务 处 理 系统 为 了 提 
高 性 能 ， 常 常 不 是 完全 地 支持 原子 性 和 隔离 性 。 某 些 站 点 的 事务 可 以 不 遵循 SERIALIZABLE 
隔离 级 别 运行 ， 在 提交 分 布 式 事务 时 不 运用 两 阶段 提交 协议 ， 采 用 异步 更 新 技术 支持 复制 过 
程 等 等 ， 这 些 情况 都 是 有 可 能 的 。 这 些 让 步 是 否 会 产生 错误 的 操作 ， 在 很 大 程度 上 取决 于 其 
应 用 程序 的 语义 。 正 因为 这 个 原因 ,: 我 们 在 构建 一 个 特定 的 应 用 程序 的 事务 处 理 系统 时 ， 必 
须 认 真 地 考虑 这 些 问 题 。 


26.9 参考 书目 


分 布 式 事务 的 全 面 讨论 可 以 在 [Gray and Reuter 1993] 里 找到 。 在 这 一 个 方面 ，[Ceri and Pelagatti 
19841 的 理论 性 更 强 一 些 。 
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两 阶段 提交 协议 是 由 [Gray 1978, Lampson and Sturgis 1979] 引 入 的 。 在 [Mohan et al. 1986] 里 讨论 


了 两 阶段 提交 协议 的 预想 的 异常 中 止 特性 。 一 个 称 为 三 阶段 提交 的 功能 更 强大 的 提交 协议 是 在 [Skeen 
1981 中 介绍 的 。 采 用 时 间 截 技术 以 避免 死 锁 的 wound-wait 和 kill-wait 系 统 是 在 [Rosenkrantz et al. 1978] 
介绍 的 。 两 阶段 提交 协议 连同 两 阶段 加 锁 本 地 并 发 性 控制 以 确保 全 局 可 串 行 化 的 证 明 ， 是 在 [Weihl 
1984] 中 介绍 的 。 合 议 庭 协议 是 在 [Giftord 1979] 中 介绍 的 。 主 拷贝 复制 是 在 [Stonebraker 1979] 中 引进 的 ， 
而 托马斯 写 入 规则 则 来 自 [Thomas 1979]. 


26.10 练习 


26.1 


26.2 
26.3 


26.4 


26.5 


26.6 


26.7 


26.8 


26.9 


车 在 两 阶段 提交 协议 内 ， 处 于 以 下 状态 时 有 一 个 伴随 程序 或 协调 程序 崩溃 ， 请 描述 其 恢复 过 程 该 
如 何 进行 ? 

a. 在 其 协调 程序 发 送 准 备 消 息 之 前 

b. 在 某 一 伴随 程序 已 投票 ， 但 其 协调 程序 尚未 决定 提交 还 是 异常 中 止 之 前 

c. 在 其 协调 程序 已 决定 提交 ， 但 该 伴随 程序 尚未 接收 到 提交 消息 之 前 

d. 在 该 伴随 程序 已 提交 ， 但 其 协调 程序 尚未 把 结束 记录 写 人 日 志 之 前 

请 说 明 在 两 阶段 提交 协议 里 ， 为 什么 一 个 伴随 程序 确实 不 该 强制 将 异常 中 止 记录 写 人 日 志 ? 

请 说 明 模 糊 转 储 恢复 过 程 该 如 何 扩展 ， 以 便 在 两 阶段 提交 协议 里 处 理 日 志 中 可 能 存在 准备 记录 的 
情况 ? 

请 描述 当 若 干 个 数据 库 管 理 程序 正在 使 用 乐观 型 并 发 控制 时 的 两 阶段 提交 协议 。 

假定 没有 任何 故障 ， 请 描述 如 何 将 两 阶段 提交 协议 扩展 到 分 布 式 事务 是 任意 的 子 事务 树 的 情况 ? 
请 描述 在 上 述 例子 的 协议 里 如 何 实现 预想 的 异常 中 止 特性 ? 

请 描述 本 书 怎样 扩展 本 书 给 出 的 两 阶段 提交 协议 使 之 可 以 处 理 采 用 时 间 发 顺序 的 并 发 控制 的 伴随 
程序 站 点 ? : 

请 给 出 正在 两 个 不 同 的 站 点 执行 的 分 布 式 事务 的 调度 ， 使 得 每 个 站 点 的 提交 顺序 不 同 ， 但 全 局 调 
度 却 是 可 串 行 化 的 。 

假设 某 个 分 布 式 系统 的 每 个 站 点 的 并 发 性 控制 是 独立 地 使 用 严格 的 两 阶段 加 锁 并 发 控制 、 某 种 乐 
观 型 并 发 控制 或 者 某 个 时 间 惟 顺序 控制 的 ， 以 便 使 冲突 事务 按 提交 顺序 串 行 化 ， 并 采用 某 个 两 阶 
段 提交 协议 。 这 样 的 分 布 式 系统 是 否 是 全 局 可 串 行 化 的 吗 ? 


26.10 扩展 的 两 阶段 提交 协议 的 第 1 阶段 同 我 们 已 经 描述 过 的 两 阶段 提交 协议 的 第 1 阶段 相同 。 回 想 本 书 


描述 的 两 阶段 提交 协议 ， 共 提交 记录 是 在 第 1 阶段 完成 之 后 才 写 入 日 志 的 。 而 在 新 的 协议 里 ， 第 2 
阶段 如 下 : l 

第 2 阶段 ”车 协调 程序 在 第 1 阶段 至 少 收 到 过 一 来 异常 中 止 投票 ， 它 就 决定 异常 中 止 ， 并 向 投 

村 就 绪 的 所 有 伴随 程序 发 送 一 条 上 出 常 中 止 消息 。 若 所 有 的 投票 部 是 就 绪 ， 那 么 它 就 向 所 有 的 
伴随 程序 发 送 一 条 提交 消息 。 

如 果菜 个 伴随 程序 接收 到 一 条 异常 中 止 消息 ， 它 便 将 该 子 事 务 回 退 。 如 果 某 伴随 程序 接收 到 

一 条 提交 消息 , 它 便 强制 将 提交 记录 写 入 其 日 志 , 释放 全 部 镇 ， 并 向 协调 程序 发 送 完 毕 消息 ， 
然后 终止 。 . 

协调 程序 一 直 等 待 ， 直 到 它 从 某 个 伴随 程序 处 接收 到 第 一 条 完毕 消息 为 止 。 此 后 ， 它 强制 地 
向 其 日 志 写 入 一 条 提交 记录 。 

协调 程序 等 到 接收 到 所 有 伴随 程序 的 完毕 消息 后 ， 就 向 其 日 志 写 入 一 条 结束 记录 ， 拓 后 终止 。 

请 为 这 个 协议 描述 其 超时 过 程 和 重启 动 过 程 。 请 证 明 ， 这 个 协议 仅 在 两 种 情况 下 会 阻塞 : 协调 程 
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序 和 至 少 一 个 伴随 程序 出 现 〈 或 部 分 出 现 ) 崩溃 时 以 及 所 有 的 伴随 程序 都 崩溃 时 。 
请 为 线性 提交 协议 设计 一 个 登录 、 超 时 和 重启 动 过 程 。 切 勿 假定 存在 一 个 单独 的 协调 程序 模块 。 
假设 伴随 程序 之 间 的 所 有 通信 都 是 沿 着 一 条 链 执行 的 。 
考虑 一 个 分 布 式 事务 处 理 系统 ， 其 中 每 个 站 点 都 采用 串 行 验证 的 乐观 型 并 发 控制 ， 以 及 某 个 两 阶 
段 提交 协议 。 请 证 明 ， 在 这 些 条 件 下 ， 仍 然 有 可 能 发 生死 锁 。 
如 果 所 有 的 站 点 都 使 用 乐观 型 并 发 控制 ， 并 且 采 用 某 个 两 阶段 提交 协议 ,请 证 明 这 时 分 布 式 事务 
是 全 局 可 串 行 化 的 。 
如 果 一 个 分 布 式 事务 的 伴随 程序 已 完成 的 仅仅 是 读 取 操 作 ， 那 么 两 阶段 提交 协议 是 可 以 简化 的 。 
当 该 伴随 程序 接收 到 准备 消息 时 ， 它 便 放 弃 其 锁 ， 并 且 终 止 参与 协议 。 请 解释 为 什么 这 种 简化 后 
的 协议 能 正常 工作 ? 
考虑 下 述 原子 提交 协议 ， 它 试图 消除 在 两 阶段 提交 协议 里 出 现 的 阻塞 。 每 个 伴随 程序 都 包含 所 有 
伴随 程序 的 地 址 ， 协 调 程序 向 每 个 伴随 程序 发 送 一 个 准备 消息 。 每 个 伴随 程序 又 直接 向 其 他 的 伴 
随 程序 发 送 它 的 投票 。 当 一 个 伴随 程序 接收 到 其 所 有 伴随 程序 的 投票 时 ， 它 便 可 以 按照 通常 的 做 
法 来 决定 是 提交 还 是 异常 中 止 。 
a. 假定 没有 任何 故障 ， 请 比较 这 个 协议 里 与 两 阶段 提交 协议 里 所 发 送 的 消息 的 数量 。 假 定 发 送 所 

有 消息 所 需 的 时 间 长 度 都 相同 ， 哪 个 协议 会 运行 得 快 些 ? 为 什么 ? 
b. 当 出 现 故 障 时 ， 该 协议 是 否 仍然 能 杜绝 阻塞 ? 
练习 23.32 中 的 kill-wait 并 发 性 控制 是 建立 在 加 锁 的 基础 之 上 的 。 当 将 它 用 到 某 个 分 布 式 系统 里 时 ， 
通常 将 它 称 为 wound-wait 协 议 。 我 们 假定 分 布 式 事务 在 伴随 程序 之 间 是 采用 RPC (远程 过 程 调用 ) 
进行 通信 的 ， 以 便当 两 阶段 提交 协议 启动 时 ， 所 有 的 伴随 程序 都 已 完成 。 用 wound 原 语 取 代 kill 
原 语 。 l 
如 果 某 个 站 点 的 事务 TI 的 伴随 程序 发 出 与 那个 站 点 的 某 个 主动 性 事务 了 的 伴随 程序 的 操作 相 
冲突 的 请 求 ， 那 么 

if TS(T,) < TS(T,) then 使 T wound else 让 T, 等 待 


其 中 wound T, 意 味 着 T, 被 异常 中 止 ( 正 如 在 kili-wait 协 议 里 一 样 )， 除 非 T; 已 经 进入 两 阶段 提交 协 


议 ， 那 时 T, 将 等 待 T: 完 成 协议 。 
请 说 明 ， 这 个 协议 为 什么 可 以 防止 事务 之 间 的 全 局 死 锁 ? 
假定 嵌 套 的 事务 模型 得 到 扩展 ， 使 得 子 事务 分 布 于 网 络 的 不 同 站 点 上 。 执 行 某 个 分 布 式 嵌 套 事务 
时 ， 在 哪个 时 刻 会 使 某 个 伴随 程序 进入 准备 状态 ?请 说 明理 由 。 
在 本 书 中 我 们 介绍 过 ， 如 果 分 布 式 数据 库 系统 里 每 个 站 点 都 采用 严格 的 两 阶段 加 锁 并 发 控制 ， 并 
且 系 统 使 用 两 阶段 提交 协议 ， 那 么 事务 是 全 局 型 可 串 行 化 的 。 倘 车 并 发 控制 不 是 严格 的 (然而 却 
是 两 阶段 的 )， 这 个 结论 是 否 还 成 立 ? 
请 说 明 如 何 利用 触发 器 来 实现 同步 更 新 复制 ? 
请 设计 一 个 合议 庭 协 议 ， 其 中 没有 时 间 改 字段 ， 但 每 个 数据 项 都 有 一 个 版 本 号 字段， 它 每 逢 数据 
项 写 人 时 进行 更 新 。 
考虑 一 个 合议 庭 协 议 ， 其 中 每 个 数据 项 保存 5 份 拷贝 ， 每 次 读 取 和 写 信 法官 的 数目 均 为 3 个 。 请 给 
出 一 个 满足 以 下 条 件 的 调度 : 
3 个 不 同 的 事务 欲 对 数据 项 执行 写 操 作 。 然 后 有 2 个 副本 站 点 出 现 故 障 ， 于 是 仅 剩 下 3 份 
拷贝 它们 全 都 包含 着 不 同 的 值 。 
请 解释 ， 为 什么 该 协议 仍然 能 正确 执行 ? 
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考虑 一 个 合议 庭 协 议 ， 其 中 每 个 数据 项 保存 n 份 拷贝 ， 每 次 读 取 和 写 入 法 官 的 数目 分 别 为 p 个 和 
4 个 。 . 
a. 出 现 故 障 但 仍然 能 使 协议 正确 工作 的 副本 站 点 的 数量 最 大 是 多 少 ? 

b. 能 够 使 得 p = 4 的 p 和 4 的 最 小 值 是 多 少 ? 

c. 请 选择 p 和 4, 使 得 出 现 故 障 但 仍然 能 使 协议 正确 工作 的 副本 站 点 数量 为 最 大 。 对 于 这 样 的 选择 ， 
最 多 允许 有 多 少 个 站 点 故障 ? 

请 说 明 在 合议 庭 复制 算 靶 里 ， 为 什么 所 有 站 点 的 时 钟 都 必须 同步 化 ? 

请 描述 复制 数据 项 的 一 个 应 用 程序 ， 其 中 可 以 不 需要 可 串 行 性 。 

以 什么 方式 使 用 你 存放 在 家 里 的 支票 本 ， 才 能 使 你 的 支票 账户 如 同一 个 异步 更 新 复制 系统 ? 

请 给 出 由 某 个 主 拷贝 异步 更 新 复制 系统 产生 出 非 串 行 化 调度 的 一 个 例子 。 

有 人 建议 采用 下 述 主 拷贝 异步 更 新 复制 协议 的 方案 来 完全 复制 系统 。 

a. 在 站 点 si 处 执行 的 事务 在 提交 以 前 ,仅仅 更 新 站 点 A 处 的 副本 。 

b. 在 事务 提交 之 后 ， 再 启动 第 2 个 事务 来 更 新 站 点 A 更 新 过 的 所 有 数据 项 的 主 拷贝 。 

c. 当 步 骤 b 中 的 事务 完成 之 后 ， 每 个 主 站 点 就 把 在 此 站 点 上 做 出 的 全 部 更 新 传播 到 其 所 有 的 次 站 
点 《包括 站 点 A 上 的 拷贝 )。 而 由 若干 事务 对 主 拷贝 所 做 出 的 更 新 ， 则 按照 原来 主 拷贝 更 新 的 
顺序 再 传播 到 其 次 站 点 。 

请 说 明 ， 为 什么 在 步骤 b 中 ， 所 有 的 主 站 点 必须 在 某 个 单独 的 事务 内 更 新 ， 而 在 步 又 c 中 更 新 才 被 

传播 到 站 点 Si。 | 

请 说 明 如 何 才能 应 用 触发 器 来 实现 主 拷贝 复制 ? 

请 为 分 布 式 保存 点 设计 一 个 登录 协议 。 





第 27 章 安全 性 与 因特网 商务 


27.1 认证 、 授 权 与 加 密 


安全 性 是 处 理 具有 权限 的 信息 或 者 与 生命 和 财产 息息相关 的 支持 系统 的 应 用 程序 设计 中 
的 一 个 主要 的 问题 。 在 绝 大 多 数 应 用 程序 中 ， 每 个 事务 的 参与 者 必须 能 极为 肯定 地 确认 彼此 
的 身份 ， 并 且 和 希望 确认 没有 任何 第 三 方 在 观察 或 者 修改 正在 交换 的 信息 。 对 于 通过 因特网 执 
行 的 事务 来 说 ， 安 全 性 问题 尤其 重要 。 因 为 冒名 顶替 者 伪装 成 特定 的 客户 或 者 服务 器 ， 以 及 
窃听 者 偷 听 事 务 参与 者 之 间 的 交换 内 容 都 相对 比较 容易 。 

认证 (authentication) 就 是 指 确认 参与 者 的 身份 的 过 程 。 当 你 在 一 台 ATM (Automatic 
Teller Machine ， 自 动 柜员 机 ) 上 实施 某 项 事务 的 时 候 ， 系统 通过 你 的 ATM 卡 信息 和 个 人 识别 
号 (PIN) 来 识别 你 的 身份 。 另 外 ， 你 可 能 希望 确认 ， 你 是 在 和 一 个 真实 的 ATM 机 ， 而 不 是 
某 个 设计 用 来 窃取 你 的 PIN 的 “特洛伊 木马 ”(Trojan horse) 对 话 。 同 样 地 ， 当 你 考虑 执行 某 
个 利用 Macy (一 种 零星 付款 ) 装置 的 因特网 事务 时 ， 将 不 得 不 向 服务 器 提供 信用 卡号 ， 这 时 
你 希望 确认 ， 你 确实 是 在 和 该 服务 器 而 不 是 躲 在 窒 室 里 伪装 成 Macy 事 务 的 三 个 学 生 对 话 。 

授权 (authorization) 就 是 指 确定 允许 特定 客户 访问 由 某 个 服务 器 控制 的 特定 资源 的 模式 
的 过 程 。 假 定 这 个 客户 事先 已 经 过 认证 。 授 权 可 以 是 对 某 个 人 授权 (允许 你 从 自己 银行 账户 
里 取款 ) 或 者 是 在 小 组 范围 内 授权 (允许 所 有 的 出 纳 员 写 入 已 认证 的 支票 )， 并 且 根 据 个 人 或 
者 小 组 能 够 执行 的 功能 进行 授权 。 例 如 ， “允许 John 从 某 个 指定 的 账户 中 提 款 。” 

mE (encryption) 常用 来 防止 未 经 授权 用 户 访问 站 点 间 传 输 的 或 存储 在 特定 站 点 的 信 
息 。 可 以 用 许多 复杂 算法 将 信息 转化 成 某 种 比特 流 ， 但 这 些 比特 流 只 有 少数 选 定 的 用 户 才 可 
能 理解 。 l 

鉴于 加 密 在 认证 和 授权 中 起 着 很 重要 的 作用 ， 所 以 我 们 先 浏览 一 下 其 大 体 结构 。 然 后 再 
讨论 认证 和 授权 ， 最 后 则 讨论 这 三 个 概念 如 何在 因特网 商务 事务 中 应 用 。 


27.2 WE 


图 27-1 为 我 们 展示 了 一 般 的 加 密 系 统 的 模型 。 需 要 传输 的 信息 一 般 是 称 为 明文 (plaintext ) 
的 一 串 字符 。 由 某 个 装置 (或 程序 ) 将 它 加 密 成 密 文 (ciphertext)， 而 实际 上 传输 的 正 是 密 文 。 
在 接收 端 ， 再 通过 另外 的 装置 对 密 文 进行 解密 ， 把 它 变 回 原来 的 明文 。 

加 密 系 统 的 目标 是 防止 入 侵 者 (intruder) 接触 信息 。 一 般 假定 入侵 采取 两 种 形式 。 第 一 
种 是 被 动 式 (passive)， 此 时 入 侵 者 只 能 够 复制 传输 中 的 信息 。 第 二 种 是 主动 式 (active), 此 
时 入 侵 者 还 可 能 修改 传输 中 的 信息 ， 重 新 发 送 (被 它 复制 过 的 ) 原先 发 送 的 消息 ， 甚 至 发 送 
新 的 消息 。 然 而 ， 目 前 还 没有 任何 实际 的 加 密 系统 能 够 绝对 杜绝 任何 具有 无 限 计算 机 资源 
(可 用 来 分 析 密 文 ) 的 人 侵 者 。 因 此 ， 加 密 的 目标 只 能 是 使 人 侵 变 得 很 困难 ， 以 至 于 每 个 人 侵 








发 送 方 密 钥 接收 方 密 钥 
拷贝 


图 27-1 一 个 加 密 系统 的 模型 


目前 存在 很 多 加 密 算法 ， 而 且 一 般 总 是 假定 入 侵 者 知道 被 攻击 系统 所 采用 的 特定 算法 。 
然而 ， 每 个 算法 都 可 参数 化 为 (控制 加 密 和 解密 过 程 的 ) 一 个 或 多 个 密 钥 (key)。 要 想 将 密 
文 恢复 为 明文 ， 若 无 解密 密 钥 ， 则 是 极端 困难 的 。 因 此 ， 技 术 的 威力 取决 于 确保 解密 密 钥 的 
机 密 性 9 。 

我 们 采用 下 述 表 示 法 

BX = Koener [明文 ] 
来 表示 密 文 是 由 发 送 者 利用 密 钥 Kn 加密 明文 而 得 到 的 。 包 括 加 密 和 解密 在 内 的 整个 加 密 系 
统 可 以 用 这 种 表示 法 表达 成 : 
明文 = K receiver [K senaer [明文 ]] 

它 表示 ， 如 果 首 先 用 Kose 对 明文 加 密 ， 然 后 再 用 Keesve 解 密 ， 其 结果 就 是 原来 的 明文 。 

1. 对 称 加 密 法 

所 谓 对 称 加 密 法 (symmetric cryptography )， 就 是 加 密 方 和 解密 方 采用 相同 的 密 钥 
(Kenger = Kreceiver) 。 此 密 钥 仅 为 正在 通信 的 两 个 过 程 所 知 (因为 它 可 以 用 来 对 密 文 解密 )， 

在 对 称 加 密 法 中 有 一 些 常用 的 技术 。 所 谓 块 密码 (block cipher)， 指 首先 将 明文 划分 成 固 
定 大 小 的 若干 块 ， 然 后 将 它们 一 对 一 地 映射 成 密 文 块 。 该 特定 的 映射 是 此 加 密 算法 及 其 密 角 
的 一 个 函数 。 窗 文 块 序列 就 是 加 密 后 的 消息 。 由 于 此 映射 是 一 对 一 的 ， 所 以 其 明文 能 够 得 到 
恢复 。 

蔡 换 密码 (substitution cipher) 是 块 密码 的 一 种 类 型 。 目前 已 提出 过 很 多 种 替换 密码 ， 用 
来 映射 明文 块 。 例 如 ， 某 个 单 表 (monoalphabetic) (有 时 称 为 简单 ) 替换 密码 ， 其 块 长 度 为 
一 个 字符 ， 而 构建 密 文 则 采用 某 个 从 字符 集合 到 其 本 身 的 一 对 一 上 映射。 因此， 倘若 将 4 映射 成 
c， 那 么 在 明文 中 凡是 出 现 4 的 地 方 ， 在 其 密 文 的 相应 位 置 中 都 替换 成 c。 

多 表 (polyalphabetic) 替换 密码 是 由 多 个 单 表 替 换 密码 组 成 的 。 例 如 ， 可 以 有 十 个 不 同 
的 单 表 密码 。 第 一 个 字符 采用 第 一 个 密码 加 密 ， 第 二 个 字符 则 用 第 二 个 密码 加 密 ， 依 此 类 推 ， 
直到 第 十 个 字符 ， 在 此 之 后 ， 从 第 11 个 字符 开始 又 再 依次 采用 第 一 个 密码 加 密 等 等 


日 一 个 真正 不 可 破解 的 加 密 系统 是 一 次 插入 (one-time pad). [Stallings 1999,Schneier 1995]， 它 采用 某 个 随机 
生成 的 、 与 该 消息 一 样 长 的 密 钥 ， 而 且 也 仅 用 于 一 条 消息 ， 用 后 就 被 丢弃 。 
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多 重 (polygram) 替换 密码 中 块 的 长 度 大 于 1。 例 如 ， 车 块 的 长 度 为 3， 则 块 “cde” 可 以 
加 密 为 “zyy”， 而 “dce” 可 以 加 密 为 “dtr”。 

换 位 (transposition) 密码 也 是 一 种 块 密码 ， 但 是 与 替换 密码 不 同 的 是 ， 每 一 个 明文 块 中 
字符 的 顺序 在 产生 密 文 块 时 进行 更 改 ， 即 对 于 每 个 明文 块 中 的 字符 重新 排序 ， 排 序 方法 通过 
密 钥 来 刻画 。 例 如 ， 如 果 将 块 “cde” 加 密 为 “dec”， 那 么 “dce” 就 会 加 密 为 “ced"。 

将 明文 块 映射 成 密 文 块 所 用 的 密码 是 频 度 分 析 攻 击 的 攻击 对 象 。 假 设 某 入 侵 者 知道 块 长 
度 ， 并 能 够 测定 每 个 明文 块 在 正常 ( 非 加 密 的 ) 通信 中 的 使 用 频 度 。 那 么 此 入 侵 者 就 可 以 将 
这 个 频 度 同 某 个 加 密 后 的 比特 流 中 窑 文 块 的 频 度 进行 比较 。 通 过 将 明文 和 密 文 中 具有 相近 频 
度 的 字符 相 匹 配 ， 入 侵 者 就 可 以 大 大 减少 为 了 决定 哪个 明文 块 映 射 到 某 个 特定 的 密 文 块 所 必 
须 测 试 的 可 能 组 合 的 数目 。 入 侵 者 能 够 监控 的 加 密 比 特 流 越 长 ， 对 密 文 块 的 频 度 估计 就 越 准 
确 ， 就 会 使 计算 量 大 大 降低 。 频 度 分 析 攻击 使 得 许多 短 长 度 块 的 替换 密码 和 换 位 密码 失去 用 
武之 地 ， 因 为 对 于 小 型 明文 来 说 ， 可 以 获得 较 准 确 的 频 度 文档 。 

ANSI 的 数据 加 密 标准 (Data Encryption Standard, DES) 是 一 种 对 称 加 密 法 技术 ， 它 采 
用 一 连 串 的 阶段 来 对 每 一 明文 块 进行 加 窗 ， 而 其 中 每 一 个 阶段 则 都 是 对 前 一 个 阶段 的 结果 进 
行 加 密 。 所 有 的 阶段 都 采用 长 度 相同 的 块 ， 而 且 每 一 个 阶段 都 是 采用 替换 密码 或 是 换 位 密码 。 
将 这 两 种 密码 技术 组 合 起 来 的 结果 有 时 候 称 为 产品 密码 (product cipher)。 目 前 广泛 应 用 的 
DES (例如 在 银行 和 金融 服务 业 )， 它 采用 的 就 是 64 比 特 的 块 长 度 和 一 个 56 比 特 的 密 钥 9 。 

比特 流 密码 (bit stream cipher) 则 是 不 以 块 为 基础 的 加 密 技术 的 一 个 例子 。 其 密 文 流 是 
对 明文 流 与 某 个 伪 随 机 数 序列 进行 异 成 操作 的 结果 ， 这 个 随机 数 序列 是 以 密 钥 为 初始 种 子 的 
随机 数 发 生 器 产生 的 。 通 过 采用 同一 发 生 器 的 密 钥 ， 在 接收 端 就 可 产生 同样 的 伪 随 机 数 序列 
来 解读 此 密 文 。 

2. 非 对 称 加 密 法 
l 与 对 称 加 密 法 不 同 ， 非 对 称 加 密 法 (asymmetric cryptography) 为 每 一 个 用 户 都 配 有 一 个 

加 密 密 钥 和 一 个 解密 密 钥 。 加 密 密 钥 是 不 保密 的 。 用 户 可 以 将 它 发 布 给 任何 想 要 给 他 发 送 消 
息 的 人 。 所 以 加 密 密 钥 是 一 个 公开 的 密 钥 ( 公 钥 )， 潜 在 的 入 侵 者 也 可 以 知道 该 密 钥 。 然 而 ， 
解密 密 钥 是 不 公开 的 ， 只 有 用 户 知道 解密 密 钥 。 如 果 M 是 一 个 (明文 ) 消息 ,而 Km Ke 
分 别 是 客户 C 的 公 钥 和 私 钥 ， 那 么 非 对 称 加 密 法 就 可 以 用 下 述 关 系 来 描述 : 


M= KE” [Keim] 


因为 利用 Ke 加密 的 某 个 消息 ， 只 要 通过 KE"* 解 密 就 能 导出 其 原始 的 明文 。 换 名 话 说 ， 发 送 
者 是 采用 接收 者 的 公 钥 来 加 密 消 息 的 ， 而 接收 者 则 利用 其 私 钥 对 它 进 行 解密 。 

一 般 情况 下， 如 果 消 息 必 须 在 两 个 进程 之 间 双 向 传递 ， 那 么 每 个 进程 都 采用 对 方 的 加 密 
窗 钥 来 加 密 消 息 。 由 于 加 密 密 钥 是 可 以 公开 的 ， 所 以 非 对 称 加 窗 法 又 称 为 公 钥 加 密 法 (public 
key cryptography ) 。 在 对 称 加 密 法 中 ， 密 钥 仅 为 彼此 通信 着 的 进程 所 知 ， 故而 称 为 私 钥 加 密 法 
(secret key cryptography )。 公 钥 加 密 的 概念 是 由 [Diffie and Hellman 1976] 提 出 的 ， 但 几乎 所 
有 的 公 钥 加 密 系统 都 是 建立 在 RSA 算 法 [Rivest et al. 1978] 的 基础 上 的 。 在 [Schneier 1995] 中 给 
出 了 对 于 RSA 算 法 的 数学 原理 以 及 许多 其 他 加 密 算法 与 协议 的 详细 的 描述 。 


日 ”加 密 专家 已 经 批评 该 密 钥 太 短 了 。 
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我 们 简要 地 描述 一 下 RSA 算 法 。 为 了 设计 一 个 加 密 / 解 密 密 钥 组 ， 首 先 选择 两 个 很 大 的 
(随机 ) 素数 p 和 gq， 另 外 再 选 一 个 整数 4， 与 (p - Dela - 1) 互 为 素数 。 最 终 ， 计 算 整 数 e 使 得 
CRE FA: 

e*d =1 (mod (p ~ 1) * (q ~ 1)) 


加 密 密 钥 是 (e, 入 )， 而 解密 密 钥 是 (d, N)， 其 中 NN = p * g， 因 而 也 称 为 模 (modulus )。 
可 以 将 需要 加 密 的 消息 分 割 成 若干 块 ， 使 得 每 个 块 M 都 可 以 看 成 是 0 到 (N - 1) 之 间 的 某 个 
整数 。 为 了 将 MM 加 密 成 为 密 文 块 C， 我 们 实施 如 下 运算 : 
C = M: (mod N) 
为 了 解密 C， 我 们 实施 
M = C’ (mod N) 
该 协议 是 可 以 正确 地 运行 的 ， 因 为 
M = (Me (mod N)) 4 (mod N) (27.1) 
这 可 以 通过 数论 的 一 些 基本 概念 进行 证 明 。 
尽管 4 和 e 在 数学 上 是 相关 的 ， 然 而 通过 因子 分 解 N (一 个 大 整数 ) 来 得 到 p 和 4 (它们 可 用 
于 从 e 计 算出 4)， 那 是 极其 困难 的 。 因 此 ， 只 有 接收 者 才能 够 解读 发 送 给 他 的 消息 。 
公 钥 加 密 法 是 一 种 功能 非常 强大 的 技术 ， 但 是 它 要 比 对 称 加 密 法 的 计算 强度 更 高 (车 计 
算 某 个 大 数 的 指数 寡 ， 尽 管 不 像 因 子 分 解 一 个 大 数 那样 难 ， 后 者 则 是 破译 加 密 所 必须 的 ， 但 
当 才 为 很 大 的 数 时 ， 计 算 起 来 也 是 很 费力 的 )。 正 因为 这 个 原因 ， 公 钥 加 密 一 般 仅 用 来 加 密 作 
为 某 个 协议 的 一 部 分 而 交换 的 小 块 的 消息 ， 而 不 是 用 来 加 密 大 块 数据 ， 大 块 数据 一 般 采 用 对 
称 技 术 加 密 。 . 


27.3 数字 签名 


非 对 称 加 密 法 的 一 个 非常 重要 的 作用 就 是 实现 数字 签名 (digital signature ) ， 数 字 签名 
可 以 作为 某 个 文档 的 出 处 证 明 ， 就 像 日 常生 活 中 应 用 的 手写 签名 一 样 。 和 公 钥 加 密 法 一 样 ， 
这 一 概念 是 在 [Diffie and Hellman 1976] 中 首次 采用 的 ， 但 是 和 公 钥 系统 一 样 ， 绝 大 多 数 数 
字 签 名 系统 也 是 建立 在 RSA 算 法 [Rivest et al. 1978] 或 者 是 特别 为 签名 而 开发 的 其 他 算法 的 基 
础 上 的 。 

建立 在 加 密 算法 基础 上 的 数字 签名 应 用 了 许多 非 对 称 加 密 法 算法 的 一 种 特性 ， 即 公 钥 和 
私 钥 的 角色 可 以 对 换 。 私 钥 可 以 用 来 加 密 明文 ， 由 此 而 得 的 密 文 则 可 以 通过 采用 相对 应 的 公 
钥 来 解密 。 因 此 ， 我 们 有 


与 加 密 不 同 ， 这 里 发 送 者 用 私 钥 来 加 密 该 签名 ， 而 接收 者 则 用 发 送 者 的 公 钥 来 恢复 签名 。 

.如 果 公 钥 算法 有 (27.2) 的 特性 ， 那 么 C (发 送 者 ) 就 可 以 证 明 是 她 通过 对 M 用 Ke” 加 密 而 
发 出 的 消息 M。 如 果 接收 者 可 以 通过 K 恢复 M， 那 么 接收 者 就 知道 M 只 能 是 C 发 出 的 ， 因 为 
仅 有 C 才 知道 Ke。( 其 他 人 也 许 确实 发 送 过 此 消息 ,但 是 只 有 C 才 能 生成 它 .) 这 一 技术 假设 
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接收 者 知道 C 的 公 钥 KE 。 发 布 公 钥 的 过 程 和 相关 的 问题 将 在 27.4 和 27.7.1 节 中 讨论 。 

值得 注意 的 是 ， 由 于 任何 人 都 可 以 用 公 钥 来 解密 消息 ， 所 以 该 消息 就 不 是 隐 项 的 。 因 此 ， 
隐藏 消息 不 是 任何 数字 签名 协议 的 目的 。 

这 种 技术 的 一 个 问题 是 ， 采 用 公 钼 算法 来 加 密 和 解密 整个 的 消息 可 能 造成 计算 强度 很 高 
而 且 花费 时 间 的 后 果 。 为 了 减少 计算 时 间 ， 可 以 计算 M 的 某 个 函数 f (例如 ， 某 种 检查 和 或 者 
某 个 散 列 函 数 ) ， 它 将 产生 比 M 自 身 小 得 多 的 某 个 结果 。FA) 有 时 候 称 为 M 的 消息 摘要 
(message digest)。 也 假设 入侵 者 ( 像 通信 者 一 样 ) 知道 消息 摘要 函数 [/。 用 KE” 对 AM) 加 密 ， 
并 称 其 为 数字 签名 ， 它 是 随 M 一 起 传播 的 。 因 此 ，C 向 接收 者 发 送 了 两 项 内 容 ， 即 Ke" AMI 
和 M。 接 收 者 采用 KE” 解密 第 一 项 ， 并 将 其 结果 与 对 第 二 项 应 用 f 所 得 到 的 结果 进行 比较 。 
如 果 两 者 是 相同 的 ， 那 么 接收 者 能 够 得 出 结论 : 只 有 C 才 可 能 发 出 M。 但 是 ， 为 了 安全 起 见 ， 
要 得 出 这 样 一 种 结论 ， 我 们 还 必须 要 处 理 一 些 其 他 的 问题 。 

不 妨 考 虑 某 个 入 侵 者 正在 窃听 和 复制 从 C 到 其 服务 器 所 传输 的 内 容 。 . 

1) 该 入侵 者 可 以 利用 C 发 送 消息 M 时 附带 的 签名 K [KaMO)] 来 签署 另外 一 个 不 同 的 消息 
M'， 以 便 能 够 迷惑 接收 者 ， 使 其 相信 C 发 送 的 是 M'。 若 他 能 够 构建 出 M' 使 得 KM) = MWR, 
那么 人 侵 者 的 这 一 攻击 是 有 可 能 成 功 的 。 为 了 杜绝 这 类 攻击 ， 我 们 要 求 /是 一 个 单 向 函数 
(one-way function)， 即 /具有 以 下 特点 : 已 知 某 个 结果 y， 要 求 构建 出 自 变量 x， 使 得 f(x) = yE 
计算 上 是 不 可 行 的。 例如 ， 某 个 单 向 消息 摘要 函数 可 以 产生 满足 以 下 特性 的 结果 申 : 

a. 在 f 值 域内 的 所 有 值 都 是 等 概率 的 。 

b. 若 修 改 该 消息 的 任何 比特 ， 那 么 消息 摘要 中 的 每 个 比特 都 有 50% 的 概率 会 改变 。 

特性 b 保 证 了 KM) 和 /LM') 不 会 相同 ， 因 为 M 和 M' 是 相关 的 或 者 类 似 的 消息 。 特 性 a 确保 不 可 
能 很 容易 地 找到 满足 KM) = KM") 的 M'， 因 为 /将 很 大 比例 的 消息 映射 到 AM)。 

对 于 该 人 侵 者 而 言 ， 要 在 这 些 条 件 下 构建 出 某 个 消息 M'， 使 得 KM) 等 于 KM) 是 极其 困难 
的 。 因 此 ， 要 找 出 一 个 可 以 依附 到 消息 M' 上 的 签名 Ke" [KM)]， 也 是 很 难 的 。 另 外 ,该 入 侵 
者 也 不 可 能 伪造 出 可 以 依附 于 M 的 签名 KE" [KM)]， 因 为 他 并 不 知道 KE” 。 

2) 该 人 侵 者 也 许 是 企图 复制 ， 然 后 第 二 次 地 再 发 送 一 个 带 有 此 签名 的 消息 ， 这 称 为 回 
放 攻 击 (replay attack)。 可 以 通过 让 客户 构建 一 个 时 间 蕉 (采用 在 第 26 章 中 提 到 的 技术 )， 并 
将 它 包 含 在 该 消息 里 ， 来 处 理 回放 攻击 。 数 字 签 名 是 针对 整个 消息 而 计算 出 来 的 。 假 设 在 网 
络 中 所 有 站 点 上 的 时 钟 是 大 致 同步 的 ， 如 果 接 收 者 保持 有 一 份 最 近 接 收 到 的 所 有 消息 的 时 间 
戳 列 表 ， 并 且 拒 绝 接收 包含 在 此 列表 中 的 时 间 戳 的 到 达 消 息 (注意 ,时间 蕉 在 全 局 范围 内 是 
唯一 的 )， 那 么 它 就 可 以 侦 测 到 该 消息 是 第 二 次 到 达 的 。 这 里 的 关键 在 于 ,时间 戳 是 不 重复 的 。 
如 果 每 个 消息 都 有 一 个 唯一 的 顺序 号 ， 那 么 也 可 以 破解 回放 攻击 问题 。 

除了 确认 签名 者 的 身份 之 外 ， 数 字 答 名 还 保证 了 该 消 息 的 完整 性 。 尽 管 该 消息 是 透明 传 
输 的 ， 并 因此 可 能 被 某 个 人 侵 者 读 取 ， 但 它 不 可 能 被 入 侵 者 修改 ， 因 为 修改 过 的 消息 的 签名 
是 不 同 的 。( 如 果 希 望 保持 私密 性 ， 那 么 签 过 名 的 消息 可 以 用 另 一 个 密 钥 加 密 。) 

数字 签名 还 防止 了 否认 行为 (repudiation )。 签 名 者 不 能 否认 构建 过 此 消息 ， 因 为 数字 签 
名 和 消息 只 能 用 该 签名 者 的 私人 密 钥 构建 出 来 。 数 字 签名 经 常 应 用 于 商业 的 安全 协议 中 。 


O 若 该 消息 是 C 请 求 将 资金 转 人 该 人 侵 者 的 银行 账户 中 的 话 ， 那 么 有 可 能 利用 这 种 攻击 。 
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27.4 窗 角 发布 与 认证 


无 论 是 对 称 加 密 法 还 是 非 对 称 加 密 法 ， 在 双方 能 够 通信 之 前 ， 它 们 必须 就 所 用 的 加 密 / 解 
密 密 钥 达 成 共识 。 由 于 完成 以 上 工作 涉及 在 消息 中 讨论 通信 时 的 密 钥 ， 因 此 协议 的 这 一 阶段 
就 称 为 密 角 发 布 (key distribution)。 在 大 多 数 情况 下 ， 密 钥 发 布 也 涉及 认证 。 在 双方 就 密 钥 
达成 共识 的 同时 ， 它 们 也 都 确认 了 对 方 的 身份 。 

有 人 也 许 会 认为 密 钥 发 布 对 于 非 对 称 算法 而 言 很 容易 ， 因 为 接收 者 的 加 密 密 钥 是 公开 的 。 
也 就 是 说 ， 如 果 C 想 要 给 5 发 送 某 个 加 密 的 消息 ， 他 只 要 向 5 发 送 一 个 透明 的 (不 加 密 的 ) 请 求 ， 
要 求 得 到 $ 的 公 钥 。 然 后 5 就 可 以 把 他 的 密 钥 (透明 地 ) RAC. 但是, 事情 不 是 那么 简单 的 。 
入 侵 者 也 许 会 在 中 途 拦截 5 的 消息 ， 并 将 消息 换 成 他 自己 的 公 钥 。 一 旦 C 采 用 了 入 侵 者 的 密 钥 ， 
那么 人 侵 者 就 能 够 解读 C 发 送 给 $ 的 所 有 的 消息 。 因 此 ， 通 过 在 采用 公 铀 加 密 时 进行 认证 ， 可 
以 使 密 钥 发 布 变 得 复杂 ， 因 为 C 必 须 能 够 鉴别 密 钥 发 送 者 的 身份 。 

在 对 称 加 密 的 情况 下 也 存在 类 似 的 问题 。 如 果 对 于 每 个 进程 P 都 有 一 个 唯一 〈 对 称 ) 的 密 
钥 ， 用 于 加 密 和 解密 消息 ， 那 么 所 有 要 向 P 发 送 的 进程 就 都 应 当知 道 这 个 密 钥 。 但是， 如 此 一 
来 ， 每 个 发 送 者 就 都 可 以 解读 由 其 他 人 发 送 给 P 的 所 有 消息 了 ， 因 为 该 密 钥 也 能 用 来 解密 一 一 
这 是 令 人 无 法 接受 的 。 这 一 问题 的 常用 解决 方法 是 ， 给 各 进程 之 间 的 每 次 对 话 或 会 话 配 上 称 
为 会 话 密 钥 (session key) 的 某 个 唯一 (对 称 ) 的 密 钥 。 会 话 密 钥 必须 在 会 话 启动 前 创建 并 发 
布 给 进程 各 方 。 它 已 成 为 通信 上 下 文 的 一 部 分 ， 并 在 会 话 结束 时 抛弃 。 再 强调 一 次 ， 采 用 某 
个 会 话 密 钥 的 进程 都 需要 和 弄 清 持 有 该 密 钥 拷贝 的 其 他 进程 的 身份 。 

因此 ， 除 了 解决 密 钥 发 布 的 问题 外 ， 我 们 还 必须 考虑 认证 的 问题 。 直 观 而 言 ， 每 当 我 们 
说 到 某 个 客户 时 ， 其 实 我 们 同时 也 在 考虑 该 客户 进程 的 运作 所 代表 的 个 人 ， 所 以 ， 我 们 也 可 
互 换 地 使 用 这 些 概念 。 

认证 的 一 个 目的 就 是 使 一 台 服 务 器 可 以 明确 地 辨别 发 送 消息 的 客户 的 身份 ， 以 便 它 能 够 
决定 是 否 授权 其 请 求 的 服务 项 目 。 例 如 ， 是 否 允许 请 求 者 从 Macy 的 银行 账户 中 提 款 ?认证 的 
另 一 个 目的 则 是 使 得 每 个 客户 在 向 某 台 服务 器 发 送 任何 重要 的 消息 之 前 ， 能 够 认证 该 服务 器 。 
例如 ， 是 在 向 Macy 还 是 一 个 Macy 假 冒 者 发 送信 用 卡号 码 ? 

为 了 对 这 些 情况 建 模 ， 我 们 需要 涉及 主角 (principal) 的 概念 。 所 谓 主角 ， 既 可 以 是 一 个 
人 人， 也 可 以 是 一 个 进程 ， 认 证 的 目的 在 于 证 实 主角 真是 自己 所 声称 的 对 象 。 _ 

一 般 来 说 ， 某 个 人 会 通过 提供 一 些 只 有 她 本 人 才 可 能 持 有 的 东西 来 证 明 她 就 是 她 自己 所 
声称 的 人 。 其 中 最 简单 又 最 不 安全 的 就 是 口令 (password)， 在 这 种 情况 下 ， 她 个 人 所 持 有 的 
是 某 些 唯一 的 知识 。 但 是 ， 口 令 往 往 很 短 又 容易 联想 (例如 某 个 宠物 的 名 字 )， 以 利于 记忆 ， 
因此 很 容易 被 入 侵 者 破译 ， 只 要 他 愿意 尝试 足够 多 的 备 选项 的 话 。 同 样 ， 倘 若菜 个 口令 通过 
网 络 来 发 送 的 话 ， 它 就 有 可 能 被 截获 ， 从 而 被 破译 。 
安全 性 可 以 通过 要 求 菜 个 惟独 该 人 才 持 有 的 物理 项 目 (例如 一 张 令 牌 卡片 ) 来 得 到 加 强 。 

一 种 更 加 安全 的 技术 涉及 到 采用 某 些 生 物 学 标识 ， 如 指纹 或 嗓音 。 遗 憾 的 是 ， 生 物 学 机 制 的 
代价 很 高 ， 而 且 这 些 特征 的 任何 计算 机 表示 也 都 可 能 被 复制 。 | 

然而 ， 口 令 在 密 钥 发 布 和 身份 鉴别 协议 中 仍然 起 到 重要 作用 ， 这 些 协议 包含 一 些 支持 交 
换 已 加 密 消 息 的 新 技术 。 由 于 只 需要 少量 的 消息 ， 因 此 加 密 的 开销 一 般 不 太 大 ， 所 以 这 些 协 
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议 既 可 以 基于 对 称 加 密 法 (例如 Kerberos ， 参 见 27.4.1 节 的 讨论 )， 也 可 以 基于 公 钥 加 密 法 
(例如 SSL， 参 见 27.7.1 节 的 讨论 )。 然 而 ， 由 于 公 钥 加 密 法 的 计算 要 求 很 多 ， 因 此 实际 的 数据 
交换 一 般 都 是 采用 建立 在 会 话 密 钥 基础 上 的 对 称 技术 。 


27.4.1 Kerberos 协 议 : 票据 


作为 协议 的 一 个 例子 ， 该 协议 采用 对 称 加 密 法 来 为 服务 器 鉴别 每 个 客户 的 身份 ， 并 为 随 
后 的 数据 交换 发 布 一 个 对 称 的 会 话 密 钥 。 我 们 叙述 的 是 广泛 采用 的 Kerberos 系 统 的 一 种 简化 
版 本 ， 该 系统 是 由 MIT (Steiner et al. 1988, Neuman and Ts’o 1994) 设计 的 。Kerberos 是 一 
种 商业 现 用 的 中 间 件 模块 ， 它 能 够 整合 到 某 个 分 布 式 计 算 系 统 ， 并 可 以 由 某 个 TP 监 视 器 来 提 
供 服务 。 

Kerberos 协 议 采 用 一 个 称 为 密 钥 服务 器 (key server) 的 中 间 过 程 。 实 际 上 , :Kerberos 将 它 
的 密 钥 服务 器 称 为 KDS (Key Distribution Server, BHR HME SR). 。 该 密 钥 服务 器 根据 需要 
创建 会 话 密 钥 ， 并 以 一 种 仅 有 正在 通信 着 的 进程 才 知 道 的 方式 来 发 布 密 钥 。 因 此 ， 它 被 看 成 
是 一 种 可 信任 第 三 方 (trusted third party). 

每 一 个 想 要 在 某 一 时 刻 通信 的 用 户 首先 要 向 密 钥 服务 器 KS 注册 一 个 对 称 的 用 户 密 钥 
(user key )。 用 户 密 钥 并 不 是 会 话 密 钥 ， 而 是 仅 在 某 次 会 话 启 动 时 用 来 通报 会 话 密 钥 的 。 

假设 客户 C 想 要 与 某 个 服务 器 5 通信 。C 和 5 事前 各 自分 别 向 KS 注册 了 用 户 密 钥 Kcxs 和 Ksxs。 
Kcxs 仅 为 C 和 KS 所 知 ， 同 样 ，Ksxs 也 仅 为 S| 和 KS 所 知 。KS 是 C 所 信任 的 ， 即 C 假 设 KS 从 不 向 任 
何其 他 进程 通报 Kcxs， 而 KS 用 来 储存 Kcxs 的 数据 结构 足以 杜绝 任何 未 经 授权 批准 的 访问 。 同 
样 地 ，KS 也 是 $ 所 信任 的 。 

Kerberos5| 入 了 票据 (ticket) 的 概念 来 发 布 会 话 密 钥 。 为 了 理解 票据 的 作用 ， 不 妨 考虑 
图 27-2 所 示 的 以 下 的 处 理 步 又 ， 它 们 组 成 了 该 协议 的 核心 部 分 。( 与 这 里 介绍 的 其 他 协议 一 样 ， 
我 们 省 略 了 一 些 次 要 的 细节 。) 






M1:C,S 





aes 


i 





M2:Kc,xs[ 会 话 密 钥 …]， 票据 


M3: 票据 ， 鉴 别 码 ， 参 数 


图 27-2 对 称 加 密 法 中 用 于 鉴别 某 个 客户 身份 的 消息 序列 


1) C 向 KS 发 送 (透明 地 ) 一 条 消息 M1， 请 求 一 张 票据 来 向 5 表明 C 的 身份 。M1 包 含 通信 
双方 的 名 称 (C，5)。 
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2) 当 KS 收 到 M1 时 ， 它 采取 以 下 的 动作 : 
a. KSJ (PENE) 构建 某 个 会 话 密 钥 Kcsscas。 
b. 接着 KS 向 C 发 送 一 条 包含 下 述 两 项 内 容 的 消息 M2: 
i. Koxs [Kcas, S, LT] 
ii. Ksxs [Ksess,cas, C, LT 一 一 即 实际 的 票据 
其 中 LT 是 该 票据 生效 的 生命 周期 (时 间 间 隔 )。 
3) 当 C 收 到 M2 后 ， 它 实施 以 下 步骤 : 
a. C 根 据 Kcxs 的 第 一 项 内 容 恢复 Kcsscas ( 它 无 法 解读 该 票据 )。 
b. C 储 存 该 票据 直到 它 准 备 好 向 8 请 求 某 些 服务 。 
值得 注意 的 是 ，KS 并 不 知道 M1 的 实际 来 源 ，M1 完 全 可 能 是 一 个 冒充 C 的 入 侵 者 /所 发 送 的 。 
然而 ， 由 于 KS 加 密 了 M2， 使 得 其 返回 的 消息 只 能 为 C 和 5 所 访问 。 
当 需 要 采用 主角 的 口令 Pc 以 支持 C 的 登录 时 ，C 则 在 某 种 保护 模式 下 构建 它 的 用 户 密 铀 
Kcxs， 而 不 是 储存 其 用 户 密 钥 。 这 是 在 某 个 单 向 函数 了 的 帮助 下 完成 的 。 
Kexs =f (Po) 
因而 ， 只 有 C 可 以 利用 f 创建 出 Kcxs， 并 且 只 有 C 才 能 够 从 M2 的 第 一 项 检索 出 Kscas: 该 消息 
是 KS 发 送 给 声称 为 C 的 进程 的 。 注 意 ， 该 协议 并 未 在 网 络 上 发 送 Pc， 因 此 避免 了 口令 被 复制 
的 可 能 性 。 另 外 ， 由 于 C 并 不 储存 Kcxs， 因 此 它 被 窃取 的 可 能 性 也 降低 了 。 
以 后 ， 当 C 想 要 请 求 5 支持 某 种 服务 器 操作 时 ， 就 可 以 采取 以 下 的 动作 : 
4) C 向 8 发 送 某 个 消息 M3 ， 其 中 包含 请 求 调 用 的 参数 ( 既 可 以 通过 及。。css 对 其 加 密 ， 也 可 
以 不 加 密 )、 该 票据 和 一 个 鉴别 码 (参见 下 文 )。 
只 有 5 才 可 以 解读 该 票据 ， 并 复原 已 加 密 项 。 然而， 单 赁 (包含 C 的 ) 票据 是 不 足以 向 S 认 
证 C 的 身份 ， 因 为 [可 能 在 步 又 2 中 复制 了 该 票据 ， 并 在 它 自己 的 调用 中 向 8 回放 。 利 用 时 间 葵 
也 许可 以 防止 回放 ， 可 是 时 间 惟 不 能 存储 于 此 票据 中 ， 因 为 此 票据 可 以 由 C 在 其 生命 周期 内 多 
次 使 用 。 所 以 C 就 伴随 其 票据 发 送 一 个 鉴别 码 。 监 别 码 (authenticator) 包含 一 个 (当前 ) 时 
间 戳 78 和 C 的 名 称 ， 经 Escas 加 密 而 成 的 : 
鉴别 码 = Keess.cas [C, TS] 
这 意味 着 它 只 能 使 用 一 次 。$ 可 以 通过 (由 解密 该 票据 而 确定 的 ) Kscas 来 解读 此 鉴别 码 。 
至 此 ，5 便 知道 该 票据 只 能 是 KS 所 创建 的 ， 因 为 只 有 KS 才 知 道 Ksxs。 另 外 ， 由 于 S 信 任 Ks， 
而 且 每 次 传递 的 K,。sscas 都 是 由 Kcxs 或 者 Ksxs 加 密 的 ， 所 以 ，5 知 道 只 有 C 才 知道 Kscas。 鉴 别 
码 里 包含 着 一 些 由 及 escas 加 密 的 明文 〈 例 如 C) ， 它 可 以 和 该 票据 (同样 包含 C) 所 包含 的 内 
容 相对 照 。 如 果 它 们 是 相 匹 配 的 ，$ 就 可 得 出 结论 : 肯定 是 C 创 建 了 此 鉴别 码 。 然 而 ， 为 了 向 5 
证 实 C 的 身份 (也 就 是 说 ， 使 其 相信 该 调用 请 求 确实 来 自 于 C)， 还 必须 排除 几 种 可 能 的 攻击 。 
1) 7 可 能 试图 进行 一 次 回放 攻击 ， 其 中 它 拷贝 了 该 票据 和 来 自 于 M3 的 鉴别 码 ， 并 在 以 后 
使 用 它们 。 为 了 解决 这 个 问题 ， 我 们 必须 使 得 每 个 鉴别 码 只 能 使 用 一 次 (与 票据 相反 )。C 为 
它 的 每 一 次 调用 创建 一 个 新 的 ( 带 有 某 个 唯一 时 间 截 的 ) 鉴别 码 。 只 要 它 的 时 间 惟 处 在 相关 
票据 的 生命 周期 (LT) 内 ， 它 就 是 活动 的 (live)。 为 了 确保 拷贝 鉴别 码 是 没有 任何 价值 的 ，5 
采用 以 下 的 协议 ， 以 使 其 保护 自身 免 受 回放 攻击 : 
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a. 如 果 收 到 的 鉴别 码 不 是 活动 的 ，5 就 拒绝 它 。 

b. 5 维护 一 份 其 所 接收 到 的 、 目 前 仍然 在 活动 的 鉴别 码 的 列表 。 如 果 接 收 到 的 鉴别 码 是 活 
动 的 ， 则 5 便 将 它 和 该 列表 进行 对 比 ， 一 旦 发 现 已 经 有 拷贝 ， 就 拒绝 接受 。 通 过 保持 生 
命 周 期 信息 ，5 便 能 够 限制 必须 保存 在 此 列表 中 的 鉴别 码 的 数量 。 

2) /截获 了 消息 M3 ( 它 没有 到 达 5)， 并 试图 采用 该 票据 和 鉴别 码 来 为 其 自身 调用 某 个 服 
务 。 然 而 ， 如 果 C 选 择 了 利用 Ksess.cas 来 加 密 其 调用 的 参数 ， 那 么 1 就 不 可 能 用 自己 的 参数 来 赫 
代 它 ， 因 为 它 并 不 知道 Kscsscas。 对 于 1 来 说 ， 在 稍 后 的 时 间 里 发 送 整个 被 截获 的 消息 是 没有 什 
么 实际 意义 的 ， 因 为 那 只 不 过 导致 满足 C 的 原始 请 求 。 

3) 1 截获 M1 并 将 其 置换 成 消息 (C， 站 。 在 这 一 攻击 中 ，/ 的 目的 是 为 了 迷惑 C， 使 其 误 认 7 
为 Ss， 并 且 让 C 以 为 它 是 在 通过 M3 向 S$ 发 送 其 参数 ， 从 而 获得 包含 在 该 参数 中 的 关于 C 的 私密 消 
息 。 协 议 通 过 将 服务 器 的 名 称 包含 在 M2 的 第 一 项 里 ， 防 止 了 这 一 攻击 。C 利 用 这 一 一 消息 来 确 
定 该 进程 的 身份 ， 即 它 应 当 能 够 解读 其 调用 消息 。 

该 协议 可 以 提供 很 多 级 别 的 保护 。 客 户 可 以 要 求 仅 当 首次 建立 对 服务 器 的 连接 时 才 进 行 
认证 。 也 可 以 要 求 每 次 请 求 服务 时 都 进行 认证 ， 还 可 以 要 求 利 用 Kescas 来 加 密 (在 M3 中 的 ) 
调用 的 参数 、( 在 M4 中 的 ) 返回 的 结果 ， 以 及 同时 加 密 其 鉴别 码 。 

我 们 已 经 给 出 了 参数 ， 以 阐释 Kerberos 如 何 防止 一 个 人 侵 者 试图 进行 的 各 种 攻击 。 不 要 以 
为 我 们 的 讨论 已 经 证 明 Kerberos 是 安全 的 ， 其 实 并 没有 。 这 样 的 证 据 是 正在 进行 研究 的 课题 。 

一 次 性 签名 

Kerberos 提 供 了 一 种 称 为 一 次 性 签名 (single sign-on) 的 特性 ， 随 着 客户 交互 变 得 越 来 越 
复杂 ， 它 也 变 得 越 来 越 重 要 。 复 杂 的 交互 经 常 涉及 访问 多 种 资源 ， 以 及 访问 多 台 服 务 器 。 每 
一 台 服 务 器 都 需要 认证 该 客户 的 身份 ， 而 在 最 坏 的 情况 下 ， 为 了 完成 这 项 任务 还 要 有 它 自 身 
固有 的 接口 。 另 外 ， 访 客户 所 使 用 的 口令 ， 对 于 它 所 访问 的 每 一 台 服 务 器 来 说 可 能 都 是 不 同 
的 。 因 此 ， 每 个 客户 都 必须 记 住 多 套 口令 ， 并 涉足 多 个 认证 协议 。 而 每 当 客户 信息 有 所 变动 
时 ， 系 统管 理 员 还 必须 保持 着 当前 与 每 一 台 服 务 器 相关 联 的 认证 信息 。 

采用 一 次 性 签名 方式 ， 该 客户 只 需要 认证 其 身份 一 次 。Kerberos 通 过 将 认证 集中 在 认证 服 
务 器 (authentication server) (类 似 于 KS) 中 ， 来 提供 这 一 特性 。 它 在 登录 时 通过 该 客户 提供 
的 口令 来 认证 C 的 身份 ， 就 像 我 们 前 面 所 描述 的 一 样 。 由 于 该 客户 想 要 访问 的 服务 器 的 身份 在 
这 一 有 时刻 可 能 还 不 知道 ， 因 此 ， 认 证 服务 器 不 可 能 创建 出 合适 的 票据 (每 一 张 票 据 都 是 用 某 
个 特定 的 服务 器 密 钥 加 密 的 )。 相 反 ， 它 向 C 返 回 一 张 票据 授权 票据 (ticket-granting ticket), 
这 是 用 来 向 某 台 服务 器 请 求 服务 的 ， 这 人 台 服 务 器 称 为 票据 授权 服务 器 (ticket-granting server), 
即 TGS ， 也 是 Kerberos 的 一 部 分 。 其 后 ， C 就 可 以 通过 票据 授权 票据 向 TGS 请 求 它 所 需要 的 特 
定 的 票据 (例如 ， 用 于 $ 的 一 张 票据 )。 

认证 服务 器 生成 C 用 来 ST OSHS TB EE Koen cares 并 将 其 返回 给 C (其 格式 与 
上 述 简 化 协议 中 的 M2 的 相 类 似 )。 

° Kcgs [Ksess,carGs, TGS, LT]—Ksess.caros 是 用 于 与 TGS 通信 用 的 一 个 会 话 密 钥 。 

°Kros.xs [Ksess,caras, C, LT] 一 一 用 于 TGS 的 票据 授权 票据 。 

其 中 Krosxs 是 TGS 向 KS 注册 的 密 钥 。 
然后 ， 当 C 想 要 访问 某 台 特 定 的 服务 器 $ 时 ， 它 便 将 该 票据 授权 票据 的 一 份 拷贝 连同 该 服 
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务 器 的 名 称 ( 和 一 个 鉴别 码 ) 一 起 发 送 给 TGS。7GS 然 后 再 返回 给 C (其 格式 仍然 与 M2 的 相 
类 似 )。 

* Ksessicaras [Ksess,cass $, LT]——Ksess.cas 是 用 于 与 5 通信 用 的 一 个 会 话 密 钠 。 

* Ks.xs [Ksess,cas, C, LT]— 用 于 $ 的 票 握 。 

于 是 ，C 为 它 打算 访问 的 每 一 台 服务 器 都 获得 了 一 张 不 同 的 票据 。 它 参与 的 是 一 个 认证 协 
i, 而 且 ， 由 于 票据 的 使 用 在 用 户 级 是 不 可 见 的 ， 其 用 户 接 口 也 得 到 了 简化 。 此 外 ， 由 于 认 
证 集中 在 单独 的 一 台 服 务 器 里 ， 所 以 认证 信息 的 管理 也 得 到 简化 。 


27.4.2 临时 串 . 


临时 串 (nonce) 是 由 一 个 进程 所 创建 的 某 个 比特 串 ， 其 创建 的 方式 使 得 其 他 的 进程 很 难 
再 创建 出 相同 的 串 。 例 如 ， 由 某 一 个 进程 随机 创建 的 有 足够 长 度 的 比特 串 ， 不 大 可 能 以 后 再 
被 其 他 进程 创建 。 临 时 串 有 多 种 用 途 ， 其 中 之 一 是 和 认证 有 关 的 。 

当 进 程 P. 和 P; 共 享 一 个 会 话 密 钥 K,。,， 而 且 P 向 P 发 送 一 个 加 密 的 消息 M1 并 期 望 得 到 一 个 
加 密 的 应 答 M2 的 时 候 ， 就 会 碰 到 需要 通过 临时 串 解决 的 问题 。 当 己 收 到 M2 时 ， 它 如 何 肯 定 这 
是 由 Ps 发 出 的 ?看 起 来 似乎 P1 只 要 采用 ,解密 M2 再 看 其 结果 是 否 有 意义 就 可 以 了 。 然 而 ， 
要 确定 某 个 串 是 否 有 意义 ， 一 般 都 需要 人 工 的 干预 ; 而 在 有 些 情况 下 ， 其 至 连 人 工 干 预 都 不 
起 作用 。 不 妨 考虑 下 述 情 况 ， 即 M2 只 包含 由 己 计 算出 来 的 数据 串 (一 种 完全 任意 的 比特 串 )。 
7 可 能 会 用 某 个 随机 的 串 来 替换 M2。 当 已 采用 及。 来 解读 该 串 的 时 候 ， 它 可 能 产生 看 来 像 是 数 
据 串 的 另 一 个 串 。 但 是 ， 不 重复 忆 的 计算 ， 己 就 无 法 确定 该 串 是 否 正确 。 作 为 一 种 选择 ，/7 可 
能 会 回放 在 同一 个 会 话 期 间 发 送 的 并 且 是 用 Ks 加 密 的 某 个 较 早 的 消息 。 在 某 些 情况 下 ， 这 样 
”的 一 种 回放 也 许可 能 是 对 M1 的 一 种 正确 的 回应 ， 从 而 ，Pi 会 由 于 接受 它 而 造成 错误 。 

在 该 问题 的 临时 串 解 决 方案 中 ,Pi 在 M1 中 包含 一 个 临时 串 N, 而 P 则 在 M2 中 包含 有 N + 1。 
一 旦 接收 到 M2 后 ，P, 就 知道 发 送 者 一 定 能 解读 M1， 因 为 返回 的 是 N+ 1, 而 不 是 简单 地 回放 N。 
”这 意味 着 发 送 者 知道 Ks， 所 以 必定 是 P;。 | 

在 Kerberos 中 ， 时 间 惟 TS (已 经 是 鉴别 码 的 一 部 分 ) 就 可 以 作为 一 个 临时 串 ， 因 此 不 再 
需要 添加 附加 项 。 该 服务 器 可 以 在 M4 中 包含 TS + 1。 

临时 串 经 常会 由 于 一 种 完全 不 同 的 原因 而 应 用 于 加 密 协议 中 。 若 在 加 密 消息 前 对 明文 附 
加 一 个 大 的 随机 数 ， 那 么 对 于 该 入侵 者 来 说 ， 指 望 通过 猜测 其 部 分 内 容 ( 例如， 猜测 截止 日 
期 或 者 某 个 信用 卡号 中 的 一 些 元 余 信息 ) 并 通过 这 些 信息 来 降低 硬性 搜索 密 钥 的 开销 ， 从 而 
破译 该 密 钥 是 极端 困难 的 。 临 时 串 的 这 种 作用 有 时 候 可 看 成 向 某 个 消息 添加 调料 (salt)。 我 
们 后 面 将 讨论 的 很 多 协议 中 ， 都 采用 着 加 过 调料 的 消息 。 但 在 我 们 的 讨论 里 ， 则 省 略 了 协议 
的 这 部 分 内 容 。 在 某 些 协议 中 ， 用 于 此 目的 的 临时 串 称 为 患 惑 者 (confounder)。 


27.5 授权 


认证 了 某 个 客户 的 身份 后 ， 服 务 器 必须 接 下 来 要 决定 是 否 应 该 批准 其 所 请 求 的 服务 。 因 
此 ， 当 一 个 来 自 于 某 个 客户 的 访问 特定 对 象 的 请 求 到 达 时 ， 系 统 的 认证 组 件 必须 决定 是 否 应 . 
该 允许 此 主角 去 访问 其 所 请 求 的 对 象 。 这 称 为 授权 策略 (authorization policy). 某 个 对 象 可 
以 被 访问 的 模式 取决 于 该 对 象 受 保护 的 类 型 。 
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例如 ， 如 果 该 资源 是 一 个 文件 ， 那 么 访问 的 模式 可 能 是 读 取 、 写 人 、 追 加 和 执行 。 操 作 
系统 一 般 通 过 以 下 方式 来 控制 对 存储 在 文件 系统 中 的 文件 的 访问 ， 即 首先 要 求 在 登录 时 认证 
主角 自己 的 身份 ， 然 后 检查 对 该 文件 的 每 一 次 访问 是 否 事先 获得 此 文件 的 所 有 者 的 授权 。 通 
常 (在 Windows NT 和 UNIX 的 许多 版 本 中 ) 用 来 记录 系统 的 保护 策略 的 数据 结构 是 ACL 
(Access Control List， 访 问 控制 列表 )。 

每 个 文件 都 有 一 个 相关 的 ACL， 该 ACL 的 每 一 项 都 标识 着 某 个 主角 ， 并 为 每 一 种 可 能 的 
访问 模式 都 包含 1 位 。 第 ;位 对 应 于 第 ;种 访问 模式 ， 

并 说 明 是 否 允 许 某 主 角 以 该 种 模式 来 访问 此 文件 。 a fe wa 

图 27-3 显 示 了 某 个 文件 的 ACL 。 前 5 位 包含 一 个 Id。 Haag 

随后 的 每 一 个 位 对 应 于 一 种 访问 模式 : RR. BA. 

追加 和 执行 。 该 图 说 明 Id 为 11011 的 用 户 有 权 读 取 和 图 27-3 某 个 文件 的 访问 控制 列表 “ 
写 人 该 列表 所 对 应 的 文件 。 

从 实用 的 角度 考虑 ， 有 必要 介绍 组 (group) 的 概念 。 例 如 ， 单 独 地 在 某 个 普遍 可 以 读 取 
的 文件 的 ACL 中 列 出 所 有 的 主角 是 一 种 很 笨拙 的 做 法 。 简 单 地 讲 ， 组 就 是 一 系列 的 主角 ， 它 
对 应 于 ACL 的 某 一 项 。 包 含 在 某 项 中 的 访问 权限 ， 是 允许 该 组 的 所 有 成 员 使 用 的 。 因 此 , E 
如 图 27-3 所 说 明 的 那样 ， 一 个 普遍 可 读 取 、 但 只 有 它 的 所 有 者 才能 够 写 入 的 文件 ， 可 能 持 有 
一 份 由 两 项 组 成 的 ACL。 其 中 一 项 是 针对 Id 为 11011 的 所 有 者 ， 设 定 读 取 、 写 入 位 置 为 1; 而 
另 一 项 则 是 针对 包含 所 有 主角 的 组 ， 仅 将 读 取 位 置 1。Id 00000 标 识 由 所 有 用 户 组 成 的 组 。 通 
过 引入 组 ， 某 个 ACL 中 的 几 个 项 可 能 都 是 指向 同一 个 特定 的 主角 (例如 ， 某 个 主角 可 能 属于 
好 儿 个 组 )。 在 这 种 情况 下 ， 该 主角 的 权限 是 每 个 项 的 并 。 

事务 处 理 系统 中 存储 和 实施 某 个 授权 策略 的 结构 ， 只 不 过 是 操作 系统 保护 文件 时 采用 的 
ACL/ 组 结构 的 一 种 小 的 推广 。 资源 是 由 服务 器 控制 的 ， 所 以 每 个 服务 器 (而 不 是 操作 系统 ) 
都 要 负责 存储 ACL， 并 对 它 所 控制 的 资源 实施 授权 策略 。 服 务 器 将 输出 某 些 方法 ， 使 它们 可 
供 客户 调用 。 这 些 方法 构成 访问 该 服务 器 所 封装 的 资源 的 模式 。 简 而 言 之 ， 授 权 策略 就 是 针 
对 某 个 特定 主角 可 以 调用 的 方法 以 及 此 方法 可 以 调用 的 特定 资源 的 一 种 规定 。 例 如 ， 在 学 生 
注册 系统 中 ， 修 改 分 数 的 方法 不 能 让 任何 学 生 调用 ， 修 改 描述 学 生 个 人 信息 (如 学 生 的 地 址 ) 
的 方法 也 只 能 为 此 学 生 本 人 所 调用 ， 而 设 定 对 班级 注册 人 数 限制 的 方法 可 以 由 任何 学 校 的 教 


” 师 调用 。 





ACL 用 来 支持 这 种 推广 。 在 某 种 方法 里 ， 学 生 注册 系统 服务 器 可 能 会 采用 某 个 单独 的 
ACL, .该 ACL 包 含 一 个 针对 学 生 组 的 项 和 一 个 针对 教师 组 的 项 。 在 每 一 个 项 中 的 权限 位 对 应 
于 该 客户 可 以 调用 的 方法 。 一 个 项 只 需要 有 足够 的 位 ， 就 可 以 使 所 有 输出 方法 都 和 不 同 的 位 一 
相关 联 。 在 这 种 情况 下 ， 教 师 组 被 授予 调用 修改 分 数 和 班级 注册 人 数 方法 的 权限 ， 而 学 生 组 
则 被 授予 调用 个 人 信息 方法 的 权限 。 某 个 学 生 的 个 人 信息 只 能 由 该 学 生 本 人 更 改 的 附加 性 要 
求 应 当 单独 地 进行 检查 。 当 调用 某 个 方法 时 ， 服 务 器 就 会 检查 ACL， 若 没有 给 用 户 授予 必要 
的 权限 的 话 ， 就 会 给 调用 者 返回 一 个 错误 代码 。 

另外 ， 我 们 可 以 认为 服务 器 管理 一 些 不 同 的 资源 (班级 记录 、 个 人 记录 ) 并 分 别 为 每 一 
条 记录 分 配 一 张 ACL。 在 这 种 情况 下 ， 就 可 以 实施 一 种 粒度 更 为 精细 的 保护 。 例 如 ， 有 关 每 
个 学 生 的 个 人 记录 的 ACL 都 拥有 一 个 仅 包含 该 学 生 本 人 的 项 。 
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利用 SQL GRANT 语句 是 客户 为 某 张 表 指 定 授权 策略 的 一 种 方法 。 在 这 种 情况 下 ， 访 问 模 
式 是 对 应 于 各 种 SQL 语句 类 型 的 。SQL 服 务 器 可 以 采用 ACL 来 实现 授权 策略 ， 此 时 ， 利 用 
GRANT 语句 可 修改 与 该 语句 所 指定 的 表 。 

每 一 台 服 务 器 一 般 负 责 提供 它 自身 的 授权 模块 ， 因 为 它 所 控制 的 对 象 以 及 对 这 些 对 象 的 
访问 都 是 该 服务 器 专 有 的 。 相 反 ， 一 个 主角 的 身份 标识 和 组 成 员 标识 可 以 是 对 所 有 的 服务 器 
都 通用 的 。 每 台 服务 器 中 的 授权 模块 称 为 引用 监视 器 (reference monitor) ， 它 负责 构建 、 检 
索 和 解释 访问 控制 列表 。 实 现 这 一 目标 的 中 间 件 模块 可 能 是 由 某 个 TP 监控 器 提供 的 。 


27.6 已 认证 的 远程 过 程 调用 


许多 要 求 认证 和 授权 的 分 布 式 应 用 程序 的 目标 是 ， 对 其 主角 隐藏 所 需 协 议 的 复杂 性 。 一 
旦 该 主角 执行 了 登录 过 程 ， 服 务 调用 应 该 是 很 简单 的 ,而 认证 和 授权 也 应 该 是 不 可 见 的 ( 除 
非 侦 测 到 某 个 人 侵 )。 实 现 这 一 目标 的 一 种 方法 是 ， 在 RPC 存 根 中 实施 认证 ， 就 像 图 27-4 中 所 
显示 的 ， 并 对 于 客户 和 服务 器 表示 为 已 认证 RPC (authenticated RPC) 的 抽象 物 ， 这 是 在 分 布 
式 计算 的 DCE 模 型 中 常用 的 一 种 实现 方式 。 

在 这 种 实现 方式 里 ， 中 间 件 提供 了 该 客户 可 以 用 来 登录 和 调用 服务 器 的 API。 此 API 和 用 
于 交换 消息 ( 图 27-2 所 示 的 消息 ) 的 存根 相连 接 。 密 钥 服务 器 现在 称 为 安全 服务 器 (security 
server)， 因 为 它 既 实施 了 认证 ， 同 时 又 在 实施 授权 中 发 挥 着 重要 作用 : 它 跟踪 所 有 每 一 个 主 
角 所 属 的 组 ， 而 且 它 在 发 送 给 该 主角 的 一 张 票 据 中 还 包含 了 该 主角 所 属 组 的 Td 的 一 份 清单 。 
安全 服务 器 可 以 像 商业 现 用 中 间 件 模块 那样 容易 地 获取 。 







es a SAh: ~ 
安全 服务 器 


服务 器 柱 





服务 器 
图 27-4 柱 和 身份 认证 之 间 的 关系 


每 台 服 务 器 负责 安全 地 在 本 地 存储 其 服务 器 密 钥 Ksxs 的 一 份 拷贝 ， 同 时 使 得 每 当 接收 到 
其 个 调用 消息 时 ， 该 拷贝 都 可 供 其 服务 器 存根 使 用 。 然 后 ， 该 存根 就 可 以 解读 此 消息 中 包含 
的 票据 ， 以 确定 该 客户 的 身份 及 其 所 属 的 组 。 

服务 器 桩 API 提 供 了 一 些 调用 ， 服 务 器 可 以 使 用 这 些 调用 来 检索 该 客户 的 身份 以 及 在 服务 
器 棱 里 的 票据 中 所 包含 的 组 成 员 信息 。 对 于 每 个 客户 调用 的 授权 是 由 引用 监视 器 在 服务 器 
《而 不 是 服务 器 柱 ) 中 提供 的 ， 其 中 使 用 了 客户 的 (已 认证 的 ) 身份 、 组 成 员 信息 和 包含 在 服 





E27 È EESAN 693 


务 器 里 的 访问 控制 列表 。 


27.7 因特网 商务 


当 事 务 通 过 因特网 执行 的 时 候 ， 安 全 性 问题 尤其 重要 。 认 证 对 于 防止 一 个 站 点 成 功 地 假 
扮 成 另 一 个 站 点 是 很 重要 的 。 加 密 对 于 防止 窃听 也 是 很 重要 的 。 另 外 ， 在 参与 因特网 事务 的 
团体 之 间 普 遍 存 在 着 一 种 猜疑 ， 这 或 许 是 因为 没有 面对面 地 交流 的 缘故 ， 也 可 能 是 因为 可 以 
在 一 夜 之 间 就 冒 出 某 个 管 人 听闻 的 网 站 的 缘故 。 正 因为 这 些 原因 ， 经 常 需要 认证 彼此 的 身份 。 

我 们 需要 区 分 两 类 因特网 商务 事务 : C2B (Customer-to-Business， 顾 客 对 企业 ) 和 B2B 
(Business-to-Business ， 企 业 对 企业 )。 这 两 类 事务 的 安全 性 要 求 是 相似 的 ， 但 我 们 假设 顾客 
仅 拥 有 和 其 浏览 器 配置 的 安全 软件 ， 而 企业 则 可 以 有 更 复杂 和 更 专业 的 保护 ， 比 如 他 们 自己 
的 公 钥 和 私 钥 ， 而 这 些 都 是 顾客 所 没有 的 。 l 


27.7.1 SSL 协 议 : 证 书 

1. 证 书 

作为 某 个 因特网 事务 的 一 部 分 ， 若 服务 器 (也许 是 代表 企业 ) 想 要 对 其 他 各 方 表明 它 的 
身份 ， 那 么 可 以 利用 某 个 CA (Certification Authority， 认 证 机 构 )， 后 者 扮演 着 可 信任 第 三 方 
的 角色 。 有 很 多 公司 都 在 从 事 着 认证 机 构 的 业务 。 

CA 采用 公 铀 加 密 来 产生 证 书 (certificate ) ， 它 将 证 明 某 个 主角 的 名 称 (例如 Macy) 和 它 的 
公 钥 之 间 的 关联 性 。 该 证 书 ( 在 其 他 项 中 ) 包含 该 主角 的 名 称 和 公 和 钥 ， 而 且 它 是 用 CA 的 私 钥 
签署 的 。 由 于 CA 的 公 和 钥 是 公开 的 (而 且 很 可 能 事先 已 存储 在 用 户 的 浏览 器 里 )， 所 以 系统 中 
的 任何 进程 都 可 以 据 此 来 确定 该 证 书 的 有 效 性 。 因 此 ， 如 果 某 个 客户 想 要 安全 地 与 Macy 通 信 ， 
它 就 可 以 利用 在 包含 名 称 “Macy” 的 有 效 证 书 中 找到 的 这 个 公 钥 来 加 密 某 自 消息， 并且 可 以 
肯定 仅 有 知道 Macy 私 钥 的 进程 才能 解读 那 段 消息 。 因 而 ， 该 证 书 解决 了 可 靠 地 发 布 公 钥 的 问 
题 ， 这 是 非 对 称 加 密 的 密 钥 发 布 问题 。 它 们 可 以 在 下 面 描述 的 协议 中 采用 。 

任何 想 要 从 CA 获得 一 份 证 书 的 因特网 服务 器 S 首 先 要 产生 一 个 公 钥 和 私 钥 对 ， 并 将 其 公 
钥 再 加 上 其 他 的 信息 发 送 给 CA。CA 会 采用 多 种 方法 来 证 实 该 服务 器 的 身份 (也许 在 Dun 和 
Bradstreet 上 寻找 它 ， 也 许 是 通过 电话 和 邮件 与 该 企业 的 服务 器 所 在 地 的 人 员 进 行 通 信 )， 然 
后 向 它 颁发 一 份 证 书 ， 在 其 他 项 中 包括 

。CA 的 名 称 。 

。S 的 名 称 。 

* SHJURL. 

* SHAH. 

*。 时 间 惟 和 截止 日 期 信息 。 

CA 签署 此 证 书 ， 并 可 能 通过 电子 邮件 不 加 密 地 向 S 发 送 已 签名 的 证 书 。 然 后 ，S 证 实 它 的 
正确 性 〈 例 如， 存储 于 该 证 书 中 的 公 钥 确实 是 S 的 公 钥 )。 值 得 注意 的 是 ， 对 于 入 侵 者 而 言 ， 
一 份 证 书 就 是 其 可 以 轻易 地 获得 的 公共 信息 。 但 它 对 于 入 侵 者 是 没有 任何 作用 的 ， 因 为 每 个 
想 要 与 通信 的 客户 将 会 采用 S 的 公 钥 来 对 消息 加 窗 。 由 于 S 的 私 钥 并 没有 包含 在 证 书 中 ， 这 样 
仅 有 S 才 能够 解读 该 消息 。 
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2.SSL 协 议 

SSL (Secure Sockets Layer， 安 全 套 接 层 ) 协议 [Netscape 2000] 利 用 证 书 来 支持 因特网 上 
的 客户 与 某 台 因特网 服务 器 之 闻 (或 者 几 台 服务 器 相互 之 间 ) 的 安全 通信 和 认证 。 通 过 使 用 
证 书 ，SSL 可 以 消除 对 于 某 个 联机 密 钥 服务 器 〈 就 像 Kerberos 场 合 那样 ) 的 需求 ， 在 一 个 每 秒 
处 理 数 千 个 事务 的 事务 系统 中 ， 联 机 密 钥 服务 器 可 能 是 一 种 瓶颈 9 。 

SSL 的 一 个 目的 是 向 客户 认证 某 台 服务 器 。 由 于 这 是 利用 证 书 来 完成 的 ， 所 以 每 台 想 要 认 
证 的 服务 器 必须 首先 获得 一 份 证 书 。 另 一 方面 ， 客 户 一 般 不 需要 向 CA 注册 ， 因 而 也 不 必 持 有 
证 书 或 与 它们 相关 的 加 密 密 钥 9。。 客 户 的 登录 一 般 是 通过 浏览 器 表示 的 ， 浏 览 器 (通常 ) 没 
有 它 自 己 的 私 钥 。 然 而 ， 浏 览 器 往往 包含 和 该 神 览 器 的 供应 商 达 成 了 共识 的 所 有 CA 的 公 钥 。 
浏览 器 在 SSL 协 议 期 间 实 际 上 并 没有 和 某 个 CA 进行 通信 ， 而 每 个 CA 也 确实 不 知道 关于 浏览 器 
的 任何 私有 信息 。 

SSL 协 议 向 客户 认证 服务 器 的 身份 ， 并 创建 一 把 会 话 密 钥 供 它们 使 用 2 。 

假设 浏览 器 C 连 接 到 一 台 声 称 代表 某 企 业 E (Bilan, Macy) 的 服务 器 S。 在 这 种 情况 下 ， 
该 协议 由 以 下 步骤 组 成 : 

1) S 向 C 发 送 带 有 CA 签名 的 证 书 的 一 份 拷 贝 (以 未 加 密 方 式 发 送 )。 

2) C 验 证 采用 包括 在 其 浏览 器 里 的 CA 公 钥 的 证 书 ， 并 因此 知道 证 书 中 的 公 钥 确 是 E 的 
BR. 

3) C 产 生 一 个 用 了 E 的 公 钥 加 密 的 会 话 密 钥 ， 并 发 送 给 S。 。 

请 注意 ， 这 里 是 由 C (而 不 是 S) 来 产生 会 话 密 钥 的 ， 因 为 在 该 协议 的 这 一 点 上 ，C 可 以 
采用 BE 的 公 钼 安全 地 与 S 通 信 ， 但 是 S 却 不 能 安全 地 与 C 通 信 (也 不 存在 任何 联机 密 钥 服务 器 
( 像 Kerberos 中 那样 ) 来 产生 会 话 密 钥 )。 

一 旦 创建 了 会 话 密 钥 ，C 和 S (现在 已 经 知道 它 是 代表 E 的 ) 就 可 以 用 它 来 交换 加 密 消息 。 
协议 是 在 数据 传输 层 (TCP/IP) 和 应 用 程序 层 中 间 的 通信 层 上 运行 的 ， 对 于 应 用 程序 来 说 协 
议 的 执行 是 不 可 见 的 。 

如 果 浏 览 器 采用 会 话 密 钥 向 S 通 报 某 个 信用 卡号 码 ， 那 么 对 于 通信 的 安全 性 ， 用 户 可 以 有 
足够 的 自信 。 浏 览 器 本 身 产生 出 会 话 密 钥 ， 它 采用 E 的 公 钥 与 5 通信 ， 而 且 该 用 户 也 知道 它 采 
用 的 确 是 E 的 公 钥 ， 因 为 它 是 从 一 份 仅 可 能 由 CA 产生 的 证 书 里 获得 的 。 用 户 相信 CA 已 经 验证 
过 E 的 身份 ， 并 在 证 书 中 包含 关于 E 的 正确 的 信息 。 同 时 相信 浏览 器 的 供应 商 已 经 将 每 个 CA 的 
正确 的 公 钥 和 SSIL 协 议 的 一 种 正确 的 实施 包括 在 其 浏览 器 中 。“。 用 户 也 必须 相信 它 的 浏览 器 没 


.日 BÆ, 请 注意 : 证 书 有 一 个 显著 的 缺陷 ， 一 份 证 书 一 旦 通过 CA 授权 给 某 台 服务 器 ， 那 么 以 后 需要 吊销 时 将 
是 很 困难 的 。 相 反 ， 一 个 联机 密 钥 服务 器 则 可 以 简单 地 中 止 向 某 台 特定 的 服务 器 提供 密 钥 。 

© SSL 对 于 确 有 证 书 的 客户 有 一 份 可 供 选 用 的 认证 协议 。 

© 出 现在 SSL 协 议 中 的 一 台 训 览 器 在 它 连接 到 一 台 URL 以 https: (而 不 是 一 般 的 http: ) 开头 的 服务 器 时 ， 就 表 
明 那 是 一 个 采用 SSL 加 密 的 HTTP 协 议 。 . 

® ”SSL 实际 上 还 要 复杂 一 些 。C 产 生 一 个 先 掌握 的 秘密 (pre-master secret) 并 发 送 给 $S, 据 此 ，C 和 S 采 用 同样 
的 算法 ， 独 立地 产生 两 个 会 话 密 钥 一 一 每 个 方向 的 通信 各 一 个 。 这 将 有 效 地 提高 安全 程度 。C 和 S 还 订 以 用 
它 来 验证 该 协议 的 应 用 程序 部 分 中 消息 的 完整 性 。 

© 尽管 SSL 协议 解决 了 使 客户 获得 某 台 服 务 器 的 公 钼 的 密 钥 发 布 问题 ， 但 在 其 解决 方案 里 又 包含 了 另 一 个 密 
钥 发 布 问题 : 需要 使 该 客户 获得 CA 的 公 和 钥 。 
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有 遭受 某 个 恶意 程序 〈 也 许 它 在 早 些 时 候 曾经 下 载 过 的 ) 的 侵害 。 

至 此 ， 协 议 已 经 向 此 客户 认证 了 服务 器 的 身份 ， 但 客户 还 没有 向 服务 器 认证 自己 的 身份 。 
对 于 很 多 应 用 程序 来 说 ， 客 户 认 证 并 不 是 必需 的 。 例 如 ， 大 多 数 服务 器 会 接受 ( 可 以 提供 信 
用 卡号 的 任何 训 览 器 的 ) 某 张 信用 卡 的 采购 ， 而 无 需 判 断 该 浏览 器 是 否 真正 代表 该 卡 的 持 有 
者 。( 大 多 数 电 话 订 购 目 录 公司 都 以 类 似 的 条 件 接受 订单 。) 

对 于 另外 一 些 应 用 程序 来 说 ，S 确 实 想 要 确定 它 是 否 在 和 某 个 特定 客户 对 话 (例如 ， 在 发 
送 它 的 私人 证 券 信息 或 者 接收 某 个 股票 交易 事务 之 前 )。 向 客户 和 服务 器 提供 这 样 的 认证 的 一 
种 方法 是 商定 某 个 口令 〈 也 许 通 过 电话 )， 服 务 器 存储 这 个 口令 ， 客 户 在 创建 会 话 密 钥 后 提供 
该 口令 。 对 于 客户 来 说 还 有 另 一 个 方法 ， 即 持 有 一 份 证 书 ， 于 是 客户 和 服务 器 双方 就 可 以 彼 
此 认证 身份 。 


27.7.2 SET 协议 : HERZ 


许多 零售 商 在 蜂 客 采购 事务 中 采用 SSL 协 议 。 在 创建 会 话 密 钥 后 ， 顾 客 发 送 需 要 采购 的 物 
品 的 细节 和 信用 卡 信息 给 零售 商 的 服务 器 ， 通 过 在 代表 信用 卡 公司 的 某 个 其 他 站 点 上 验证 信 
用 卡 来 完成 该 事务 。 其 中 唯一 的 漏洞 是 让 零售 商 知道 了 顾客 的 信用 卡号 码 。 

当然 ， 在 大 多 数 的 非 因特网 顾客 一 零售 商事 务 中 ， 零 售 商 之 所 以 能 够 获得 某 个 信用 卡号 
码 ， 是 因为 顾客 将 她 的 信用 卡 交 给 了 零售 商 * 。 然而， 将 信用 卡号 码 透露 给 零售 商 ， 在 电子 
商务 中 是 会 产生 问题 的 ， 这 有 两 方面 的 原因 。 i _ 

“因为 采购 时 只 需要 信用 卡号 码 (而 并 非 信用 卡 本 身 )， 所 以 某 个 不 诚实 的 零售 商 有 可 能 

在 信用 卡 持 有 者 完全 不 知情 的 情况 下 使 用 该 号 码 ， 直 到 该 问题 暴露 为 止 。 

。 另 外 ， 因 特 网 商务 的 匿名 性 不 利于 促进 零售 商 和 顾客 之 间 的 信任 关系 。 因 此 ， 如 果 零 售 
商 不 知道 顾客 的 信用 卡号 码 ， 那 么 顾客 将 会 更 加 安心 些 。 

为 了 促进 因特网 上 电子 商务 的 发 展 ， 技 术 人 员 已 经 开发 出 了 更 加 安全 的 协议 。SET 
(Secure Electronic Transaction， 安 全 性 电子 事务 ) 协议 [VISA 2000] 就 是 其 中 之 一 ， 它 是 由 
Visa 和 MasterCard 共 间 开 发 的 。SSL 是 一 个 会 话 级 安全 协议 (session-level security protocol), 
它 确保 了 会 话 期 间 的 安全 通信 ， 而 SET 则 是 一 个 事务 级 安全 协议 (transaction-level security 
protocol) ， 它 确保 了 采购 事务 《其 中 包括 一 个 原子 化 提交 的 ) 的 安全 性 。 

SET 协议 是 很 复杂 的 ， 需 要 用 很 多 签名 和 许多 交叉 检验 来 提高 总 体 的 安全 性 。 这 里 我 们 介 
绍 一 个 简化 的 版 本 ， 它 展示 了 对 敌 售 商 隐 藏 信用 卡号 码 的 技巧 以 及 如 何 原 子 化 提交 采购 事务 。 

该 协议 涉及 到 两 个 新 的 概念 。 

。 每 个 顾客 都 有 自己 的 证 书 ， 因 此 也 有 自己 的 公 钥 和 私 钥 。 这 些 密 钥 用 来 提供 该 协议 的 一 
种 独特 的 特性 ， 即 对 偶 签 名 (dual signature) ; 它 在 很 大 程度 上 提高 了 事务 的 安全 性 。 
顾客 的 证 书 还 包含 有 一 个 他 信用 卡号 码 和 信用 卡 有 效 日 期 的 消息 摘要 。 请 回忆 一 下 , 证 
书 中 的 这 些 信息 是 不 加 密 的 。 因 此 ， 只 有 摘要 (而 不 是 信用 卡号 码 本 身 ) 可 以 被 包括 在 
其 中 。 摘 要 可 用 来 证 明 此 信用 卡号 码 是 该 顾客 提供 的 ， 也 就 是 说 它 对 应 于 该 顾客 的 某 张 
O 例如 , 当 你 去 一 家 餐厅 就 餐 的 时 候 ， 你 将 你 的 信用 卡 给 了 一 名 侍者 ， 她 验证 该 事务 并 返回 一 张 收据 让 你 签 


名 。 可 是 你 怎么 知道 她 没有 复制 你 的 信用 卡号 码 呢 ? 
O ”有些 SET 版 本 采用 一 种 改进 的 对 偶 签 名 ， 它 不 需要 顾客 持 有 自己 的 证 书 (以 及 公 钥 和 私 铀 )。 
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信用 卡 。 

“一 个 新 的 服务 器 ， 即 代表 信用 卡 公司 操 作 的 支付 网 关 (payment gateway) G。SET 是 一 
种 涉及 顾客 、 零 售 商 和 支付 网 关 的 三 方 协议 ， 支 付 网 关 在 其 协议 期 间 担当 可 信任 第 三 方 
的 角色 ， 并 在 该 事务 结束 时 完成 提交 操作 。 

该 协议 的 基本 思想 是 ， 顾 客 C 向 零售 商 M 发 送 包 含 两 个 部 分 的 消息 。 消 息 的 第 一 部 分 包括 
了 采购 的 总 额 和 采用 G 的 公 钥 加 密 的 C 的 信用 卡 信息 (所 以 M 看 不 到 该 信用卡 信息 ) ; 消息 的 
第 二 部 分 包括 采购 的 总 额 和 采购 的 细节 (但 没有 信用 卡 信息 )， 这 一 部 分 是 采用 M 的 公 和 钥 加密 
的 。 然 后 M 将 该 消息 的 第 一 部 分 转发 给 G，G 将 它 解密 ， 验 证 该 次 信用 卡 采 购 ， 并 提交 该 事务 。 

对 于 这 种 由 两 部 分 组 成 的 消息 可 能 有 一 种 攻击 ， 某 个 人 侵 者 可 能 会 将 某 一 个 消息 的 第 一 
部 分 和 另 一 个 消息 的 第 二 部 分 连 在 一 起 。 例 如 ， 一旦 截获 Joe 和 Mary 采 购 的 消息 ， 入 侵 者 就 可 
以 将 Joe 消 息 的 第 一 部 分 与 Mary 消 息 的 第 二 部 分 连接 起 来 ， 使 Joe 支 付 Mary 货 物 的 费用 。 阻 止 
这 类 攻击 的 一 种 方法 是 ， 让 M 对 每 个 事务 都 关联 一 个 唯一 的 4， 并 要 求 C 在 消息 的 两 部 分 里 都 
包含 它 。 这 样 ， 任 何 试图 合并 不 同 销 息 的 两 部 分 的 企图 就 很 容易 侦 测 到 了 。 然 而 ， 这 还 不 足 
以 解决 任何 不 诚实 的 零售 商 的 问题 ， 他 可 以 让 两 个 不 同 采 购 事务 都 以 相同 的 Id 联系 起 来 ， 从 
而 使 这 两 个 结果 部 分 的 消息 有 可 能 结合 在 一 起 。 我 们 需要 采用 一 种 新 的 机 制 来 克服 这 类 问题 。 
这 种 机 制 就 是 我 们 接 下 来 要 介绍 的 对 偶 签 名 。 

在 SET 开始 以 前 ，C 和 M 协 商 采 购 的 事项 。 该 协议 以 一 次 握手 开始 ， 此 时 C 和 M 交 换 证 书 
并 认证 彼此 身份 。C 将 其 证 书 发 送 给 M， 而 M 则 将 它 自己 的 和 G 的 证 书 一 起 发 送 给 C; 通过 提 
手 ，C 和 M 都 知道 了 对 方 的 和 G 的 公 钥 。 然 后 便 开 始 其 采购 事务 。 

1) M 发 送 已 签名 消息 给 C， 其 中 包括 某 个 (唯一 的 ) 事务 Id (这 可 用 来 防止 回放 攻击 )。C 

采用 M 的 证 书 里 的 公 钥 来 检验 签名 ， 从 而 知道 该 消息 确实 来 自 M， 而 且 在 传输 中 没有 被 改变 。 

2) C 向 M 发 送 一 条 消息 ， 其 中 包括 两 部 分 以 及 对 偶 签名 : 

a. 事务 Id，C 的 信用 卡 信息 和 采购 总 额 (但 没有 采购 物品 的 说 明 ) 一 一 以 G 的 公 钥 加 密 : 
= K"|trans_Id, credit _card _inf, $_ amount] . 
b. 事务 Id， 采 购 总 额 和 采购 物品 的 说 明 (但 没有 C 的 信用 卡 信息 ) 一 一 以 M 的 公 钥 加 密 : 


m, = Ke [trans_ ld, $_amount, desc] 


其 对 偶 签 名 包含 三 个 字段 : 
a. 消息 的 第 一 部 分 的 消息 摘要 MD: MD, = fim) 
Hp O 是 消息 摘要 函数 。 l 
b. 消息 的 第 二 部 分 的 消息 摘要 MD，,: MD, = m) 
c.C 对 于 MD 连接 MD;, 的 签名 : Ke [yn : MD,)] 
于 是 ， 完 整 的 对 偶 签 名 是 
dual _signature= MD,, MD,, K"|f(MD,-MD,)| 


从 而 ， 由 C 发 送 给 M 的 完整 消息 是 (mi， m, dual_signature), 
对 偶 签 名 将 该 消息 的 两 个 部 分 捆绑 在 一 起 。 所 以 ， 例 如 ， 某 个 人 侵 者 或 者 M 试 图 将 内 ;与 
m1! 联系 在 一 起 的 企图 是 不 会 奏效 的 ， 因 为 它们 的 消息 摘要 MD 与 MD, 是 不 一 样 的。 虽然 在 对 
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偶 签名 中 可 以 用 MD-: 赫 换 MD:， 可 是 K2"[f(MD,-MD,)| 不 能 够 作为 MD MD: 的 签名 ， 因 为 
只 有 C 才 可 以 为 重组 后 的 消息 计算 出 正确 的 对 偶 签 名 。 
3) M 可 以 用 它 的 私 钥 解读 此 消息 的 第 二 部 分 (但 是 它 不 能 破解 包含 着 信用 卡号 的 第 一 部 
分 )。 该 零售 商 然后 
a. 利用 对 偶 签 名 来 验证 m; 在 其 传输 过 程 中 没有 被 更 改 。 它 首先 计算 出 ms 的 消息 摘要 ， 
并 检查 它 是 否 和 数字 签名 (MD;) 的 第 二 部 分 一 样 。 然 后 采用 C 的 证 书 中 的 公 钥 来 检验 
第 三 部 分 确实 是 第 一 和 第 二 部 分 的 连接 的 正确 签名 。 
b. 核对 该 事务 的 4， 订 单 总 额 和 采购 物品 的 说 明 。 
全 并 VM 给 6 发 送 包 括 两 个 部 分 的 一 条 消息 ， 
a. my 和 从 C 处 接收 到 的 对 偶 签 名 : ma =m, dual_signature 
b 该 事 务 介 和 订单 总 额 一 LAM 的 税 铀 给 名 并 采用 G 的 公 钥 可 守 


= kee [trans _Id, $_amount, KZ [ Ff(trans _Id, $_ amount)]| 


M 发 送 给 G 的 完整 的 消息 是 (ma, ma) ， 以 及 C 和 M 的 证 书 的 拷贝 。 
4) G 采 用 它 的 私 钥 来 解读 该 消息 。 
a. 利用 对 偶 签名 和 C 的 证 书 里 的 公 钥 ， 来 验证 m 是 否 是 由 C 准 备 的 ， 而 且 没 有 被 更 改过 
(就 像 在 步骤 3a 中 一 样 ) 。 
b. 利用 C 的 证 书 中 的 信用 卡 信息 的 消息 摘要 ， 来 验证 其 信用 卡 信息 是 由 mi 提供 的 。 
c. 利用 ms 中 M 的 签名 和 M 的 证 书 中 的 公 钥 ， 来 检查 ms 没有 被 更 改过 。 
d. 检查 其 事务 I4 和 采购 总 额 在 my 和 ms 中 是 否 相 同 ( 以 验证 M 和 C 是 否 就 采购 达成 一 致 )。 
e 检验 事务 Id 是 否 从 来 不 曾 提交 过 (以 防止 回放 攻击 )。 
f. 进行 任何 必要 的 工作 ， 以 验证 此 项 信用 卡 请 求 。 
然后 G 给 M 返 回 一 个 签 过 名 的 已 验证 消息 。 至 此 ， 该 事务 才 被 提交 。 
5) 一 旦 M 接 收 到 此 已 验证 消息 ， 它 就 知道 该 事务 已 经 提交 了 。 然 后 ， 它 给 C 发 送 一 个 签 过 
名 的 消息 : 事务 完成 。 于 是 ，C 也 知道 该 事务 已 经 提交 。 
请 注意 ， 该 协议 是 如 何 处 理 一 些 其 他 的 攻击 的 。 
1) M 无 法 替换 不 同 的 货物 ， 因 为 该 对 偶 签 名 是 建立 在 C 所 认同 的 描述 之 上 的 。 一 旦 向 G 转 
发 了 此 对 偶 签 名 ，M 就 已 经 自己 提交 了 该 描述 。 
2) C 也 无 法 利用 从 其 他 客户 提交 的 消息 中 拷贝 出 来 的 m',， 以 图 通过 将 其 和 ms 进行 粘 合 而 
EMNE NOREN, 在 这 种 情况 下 ， 对 偶 签名 不 会 起 作用 ， 因 为 它 由 C 计 算 的 。 然 而 ， 
"和 mm 会 有 不 同 的 事务 Id， 所 以 该 事务 将 会 遭 到 G 的 拒绝 。 
用 于 SET 的 原子 化 提交 协议 
当 G 提 交 事 务 时 ， 它 将 记录 合适 的 日 期 数据 ， 使 该 事务 持久 化 。M 也 可 能 希望 在 接收 到 G 
的 验证 消息 时 提交 它 的 子 事务 。 许 多 顾客 可 能 不 希望 进行 正式 的 提交 ， 但 是 C、M 和 G 之 间 的 
消息 交换 可 以 看 成 是 一 种 线性 提交 协议 ， 在 这 种 语 境 下 
“步骤 2 中 CC 发 给 M 的 消息 和 步骤 3 中 M 发 给 G 的 消息 都 是 投 对 消息。 在 它们 发 送 之 前 前 ，C 和 
M 必 须 处 在 某 种 准备 状态 下 。 
“ 在 步骤 4 中 G 发 给 M 的 消息 和 步骤 5 中 M 发 给 C 的 消息 都 是 提交 消息 。 在 发 送 那些 消息 之 
前 ，G 和 M 必 须 将 相应 的 提交 记录 输入 到 它们 的 日 志 里 。 
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值得 注意 的 是 ，G 是 一 个 可 信任 第 三 方 ， 在 完成 提交 时 是 受到 其 他 两 方 的 信任 的 。 


27.7.3 货物 原子 性 、 托 管 与 已 认证 交付 


某 些 因 特 网 事务 涉及 到 采购 物品 的 实际 交付 。 涉 及 采购 下 载 软件 的 事务 就 属于 这 一 范畴 。 
这 样 的 事务 应 当 是 货物 原子 化 (goods atomic) 的 ， 也 就 是 说 ， 当 且 仅 当 货款 支付 后 ， 货 物 
才能 交付 。 在 SET 协议 的 语 境 中 ,“ 已 付款 ”意味 着 采购 事务 已 经 为 支付 网 关 所 验证 ; 在 
27.7.4 市 将 讨论 的 电子 现金 协议 的 语 境 中 ， 它 意味 着 电子 现金 已 交付 给 零售 商 ， 并 已 为 银行 所 
接受 。 

涉及 采购 实际 货物 的 事务 一 般 都 不 是 货物 原子 化 的 。 顾 客 订购 了 货物 ， 然 后 事务 提交 ， 
(大 多 数 情况 下 ) 在 这 之 后 ， 零 售 商 便装 运 货物 。 然 而 ， 在 因特网 商务 中 ， 当 该 事务 提交 后 ， 
顾客 可 能 不 信任 让 零售 商 来 发 送 (TR) 货物 。 

货物 原子 性 实际 上 并 不 是 一 个 新 概念 。 其 原始 思想 是 ， 交 付 货 物 这 一 事件 也 是 事务 的 一 部 
分 (其 中 已 为 货物 付款 )。 当 且 仅 当 已 付款 时 才 交 付 货物 的 要 求 ， 恰 恰 是 原子 化 事务 执行 的 通 
常 的 定义 。 实 现货 物 原子 性 的 难点 在 于 交付 无 法 回 退 ， 这 就 意味 着 车 货物 在 事务 提交 前 就 交 
付 了 ， 而 该 事务 随后 异常 中 止 了 ， 那 么 没有 任何 办 法 可 以 撤销 交付 ， 故 而 执行 不 是 原子 化 的 。 

在 21.3.2 节 中 ， 我 们 谈论 过 一 种 类 似 于 货物 原子 性 的 情况 ， 其 中 ， 当 且 仅 当 该 银行 提交 此 
取款 事务 时 ， 某 个 ATM 才 发 放 现 金 。 我 们 讨论 过 如 何 利用 一 个 可 恢复 队列 来 达到 此 目的 。 现 
金发 放 和 货物 原子 性 都 涉及 当 且 仅 当 该 事务 提交 时 发 生 的 某 个 外 部 事件 。 

货物 原子 性 的 概念 及 实现 它 的 某 个 协议 ， 是 在 开发 NetBill 系 统 时 提出 来 的 [Cox et al. 
1995]。 该 协议 与 涉及 一 位 客户 、 一 个 零售 商 和 某 个 可 信任 第 三 方 的 SET 有 些 相似 之 处 ， 后 者 
通过 某 个 线性 提交 协议 来 有 效 地 完善 某 个 信用 卡 事务 。 我 们 并 不 描述 NetBill， 而 是 要 描述 如 
何 加 强 SET 协 议 ， 以 实现 货物 原子 性 。 

在 C 和 M 就 某 项 事务 达成 共识 后 ， 但 在 C 向 M 发 送 确 认 之 前 (SET 的 步骤 2)，M 用 某 个 新 
的 对 称 密 钥 Kcw (M 创 建 这 个 密 钥 是 为 此 目的 ) 向 C 发 送 (PR) 加 过 密 的 货物 。M 同 时 还 发 
送 该 加 密 货物 的 一 份 消 息 摘要 ， 所 以 C 就 可 以 证 实 已 正确 地 收 到 此 加 密 货物 。 请 注意 ， 此 刻 C 
尚 不 能 使 用 这 些 货物 ， 因 为 她 并 不 知道 Ecw。 

在 C 发 送 给 M (Em) 的 描述 desc 里 ， 既 包括 该 货物 的 一 份 规格 说 明 ， 又 包括 用 C 的 私 
钥 签 名 的 已 加 密 货物 的 消息 摘要 。 实 际 上 ，C 知 道 它 已 经 收 到 了 (以 加 密 的 形式 ) 与 该 摘要 相 
对 应 的 货物 。 正 如 SET 的 步骤 2 一 样 ， 完 整 的 消息 是 (mi, m, dual_signature)， 而 这 也 是 C 投 要 
提交 的 。 当 收 到 了 C 的 消息 后 ， 如 果 M 认 为 其 从 C 处 收 到 的 描述 是 准确 的 ， 那 么 如 SET 的 步骤 3 
一 样 ，M 便 创建 消息 (ms, ms)， 不 过 在 ms 中 还 包括 如 下 两 个 附加 项 : 

*Kem 

“用 C 的 私 钥 签 名 的 已 加 密 货物 的 消息 摘要 ( 它 是 在 步骤 2 中 从 C 处 收 到 的 ) 再 一 次 用 M 的 

私 钥 进行 签名 (会签 )。 
M 然 后 将 此 消息 发 送 给 G (SET 的 步骤 3 )。 

一 个 不 道德 的 零售 商 也 许 想 报 一 个 更 高 的 价格 ， 但 他 无 法 更 改 该 事务 的 项 ， 因 为 C 所 建立 





O 在 此 语 境 中 “事务 ”一 词 的 用 法 是 宽松 的 。 货 物 的 实际 交付 也 可 能 在 该 事务 提交 之 后 完成 ， 但 它 是 包含 该 
事务 的 协议 的 一 部 分 。 
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的 对 偶 签 名 已 经 包含 了 价格 信息 。 通 过 在 ms 中 添加 M 对 该 消息 的 签名 ， 并 将 其 转发 给 G，M 又 
向 该 事务 提交 了 它 自 己 。 再 说 明 一 次 ， 这 一 消息 仍 是 M 投 票 提交 的 。 

当 G 从 M 处 收 到 双重 签名 的 消息 (在 SET 的 步骤 4 中 ) 后 ， 它 便 知道 双方 都 已 准备 好 提交 
该 事务 的 内 容 。 与 SET 一 样 ， 如 果 G 对 C 提 供 的 信用 卡 信息 满意 ， 它 便 提交 该 事务 ， 持 久 地 存 
储 ms、ms 和 对 偶 签 名 ， 并 给 M 发 送 一 条 已 验证 消息 。M 则 向 C 发 送 一 条 包含 Kcw 的 事务 完成 消 
息 ， 于 是 ，C 就 可 以 解读 其 货物 。 

该 协议 是 货物 原子 化 的 ， 其 原因 如 下 : 

。 如 果 在 G 提 交 该 事务 之 前 出 现 了 故障 ， 那 么 不 会 有 任何 资金 传递 ， 而 C 也 不 会 得 到 此 货 

物 ， 因 为 它 没 有 获得 Kcw。 

。 如 果 在 提交 之 后 出 现 故 障 ， 那 么 资金 将 会 传递 ，G 有 一 个 (持久 的 ) Kcw 的 拷贝 ,而 C 有 

该 货物 的 一 份 加 密 的 拷贝 。C 可 以 从 M 处 得 到 Kcw， 或 者 (如 果 因 为 某 些 原因 M 没 有 发 送 

Kem) 从 G 处 得 到 Kcw， 因 为 G 知 道 该 事务 已 经 提交 ， 而 C 的 证 书 也 证 实 了 它 创 建 该 对 侦 

签名 的 主角 的 身份 。 

该 协议 的 一 个 重要 的 特点 是 ， 当 该 事务 提交 时 ，G 便 拥有 了 Kcw 的 一 份 拷贝 ， 因 此 即便 M 
“忘记 ”了 发 送 包含 Kew 的 事务 完成 消息 ，C 仍 然 可 以 解密 其 货物 。 

1. 已 认证 交付 

因特网 上 货物 交付 的 另 一 个 问题 是 已 认证 交付 (certified delivery )。 一 个 货物 原子 化 的 事 
务 确保 了 对 顾客 的 交付 ， 但 是 我 们 还 想 要 有 附加 的 保证 : 交付 的 是 正确 的 货物 。 一 旦 出 现 发 
送 的 货物 和 先前 达成 共识 的 规格 说 明 不 符 ，M 如 何 为 它 自身 辩 白 ”C 又 如 何 肯 定 接收 到 的 就 是 
订购 的 货物 昵 ? 尤 其 是 ， 如 果 在 M 和 C 之 间 出 现 关 于 所 交付 货物 的 和 争执， 而 这 个 争执 将 由 另 一 
位 仲裁 者 来 解决 ， 那 么 M 和 C 如 何 将 各 自 的 情况 向 仲裁 者 表达 呢 ? 例如 : 

“假设 在 解密 所 交付 货物 后 ，C 发 现 它们 不 符合 其 规格 说 明 ， 并 想 要 回 她 的 钱 。C 可 以 向 

仲裁 者 阐明 该 软件 确实 无 法 工作 ， 但 是 她 如 何 表明 该 软件 就 是 M 发 送 的 软件 呢 ? 

， 假 设 C 企 图 欺骗 M， 而 她 展示 给 仲裁 者 的 无 法 使 用 的 软件 并 不 是 M 所 发 送 的 。 那 么 ，M 

又 如 何 来 揭露 这 一 欺诈 的 企图 呢 ? 

加 强 型 的 SET 协 议 符 合 已 认证 交付 的 要 求 。 不 妨 回忆 一 下 ，G 在 该 事务 提交 的 时 候 持 久 地 
储存 了 ms、ms 和 对 偶 签 名 。 由 C 创 建 的 对 偶 签 名 涵盖 了 包含 在 m 中 的 货物 的 规格 说 明 。 通 过 
将 该 签名 转发 给 G，M 便 可 确认 该 规格 说 明 是 准确 的 (因为 它 可 以 通过 解读 m* 来 审核 此 规格 说 
明 ， 并 可 以 检验 其 签名 是 涵盖 mz 的 )。 

* 通过 运行 针对 该 货物 的 摘要 函数 ， 并 将 其 结果 和 G 存 储 于 ms 中 的 摘要 进行 比较 ，C 就 可 

以 向 仲裁 者 展示 她 声称 从 M 处 接收 到 的 加 密 货物 实际 上 就 是 M 所 发 送 的 货物 。 仲 裁 者 然 ， 

后 就 可 以 利用 Kcw 来 解读 此 货物 ， 并 对 它们 进行 测试 。C 还 可 以 提供 包含 此 规格 说 明 的 

m2， 并 展示 其 对 侦 签 名 是 涵盖 m2 的 ， 因 此 也 是 经 M 同 音 的 。 仲 裁 者 现在 就 可 以 对 C 的 声 

明 作 出 裁决 了 。 

。M 也 可 以 反对 声明 (所 收 到 的 货物 不 符合 它们 的 规格 说 明 ) ， 为 自己 作 辩 护 ， 因 为 M 也 

能 够 产生 ms。 仲 裁 者 可 以 再 一 次 确认 该 货物 并 没有 被 段 改 ， 然 后 针对 其 规格 说 明 来 测试 

它们 。 
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2. 托管 服务 器 

另 一 种 要 求 货物 原子 性 的 应 用 程序 是 某 个 陌生 人 或 某 个 拍卖 网 站 通过 因特网 对 实际 ( 非 电 
子 的 ) 货 物 的 采购 。 该 货物 不 能 被 下 载 ， 但 必须 通过 某 个 装运 代理 发 送 。 该 事务 的 某 一 个 参与 
者 可 能 怀疑 另 一 方 会 不 遵守 此 采购 协议 议定 的 条 件 。 双 方 如 何 确定 该 事务 是 货物 原子 化 的 ， 
以 及 当 且 仅 当 已 付 货款 时 ， 如 何 确定 货物 已 交付 呢 ? 

符合 这 些 需 求 的 一 种 实现 方法 是 采用 某 个 称 之 为 托管 代理 (escrow agent) 的 可 信任 第 三 
方 。 有 很 多 公司 都 从 事 因 特 网 上 的 托管 代理 的 业务 。 其 基本 思路 是 ， 在 顾客 和 零售 商 就 采购 
事项 达成 一 致 之 后 ， 顾 客 支付 给 托管 代理 而 不 是 支付 给 零售 商 ， 由 托管 代理 持 有 这 些 资金 ， 
直到 货物 被 交付 并 且 顾 客 收 到 货物 为 止 。 此 后 ， 托 管 代理 才 将 此 支付 款 转交 该 零售 商 。 

我 们 将 介绍 一 种 简化 的 托管 代理 协议 形式 8 ,其 中 不 考虑 很 多 细节 ,包括 认证 、 加 密 等 等 。 
该 协议 涉及 一 个 客户 C、 一 个 零售 商 M 和 一 个 托管 代理 E。 在 C 和 M 就 采购 事项 达成 一 致 之 后 ， 
该 协议 开始 。 

1) C 可 以 采用 在 本 章 中 描述 过 的 某 种 安全 付款 方法 向 E 发 送 已 达成 共识 的 货款 。 

2) E 持 久 地 存储 货款 以 及 该 协议 其 余部 分 所 需要 的 其 他 信息 ， 并 提交 该 事务 。 

3) E 通 知 M，C 已 经 付款 。 

4) M 通 过 
运 代理 (如 FedEX 或 UPS )， 向 C 发 送 其 货物 。 

5) 一 旦 C 收 到 货物 ， 他 便 对 货物 进行 检测 ， 看 它们 是 否 符合 订单 的 要 求 。 这 种 检测 必须 在 
规定 的 时 间 内 完成 ， 这 段 时 间 从 货物 交付 时 开始 ， 由 货运 代理 的 追踪 机 制 记录 。 

a. 如 果 C 对 货物 满意 ， 则 发 生 以 下 情况 : 
i. C 通 知 E 货 物 已 经 收 到 并 且 满 意 所 收 到 的 货物 。 
ii.E 将 货款 转交 给 M。 
. 如 果 C 不 满意 此 货物 ， 则 将 发 生 以 下 情况 : 
i. C 通 知 E 货 物 已 经 收 到 ， 但 是 不 满意 所 收 到 的 货物 。 
i. C 通 过 某 个 可 追踪 货运 代理 将 货物 返回 给 M，。 
ii. M 接 收 到 货物 ， 并 通知 Ee 。 
iv. E 将 货款 返回 给 C。 
c. 如 果 在 检测 时 间 结 束 后 ，C 并 没有 通知 E 他 是 否 满意 货物 ， 那 么 E 将 货款 转 给 Me 。 

该 协议 基本 上 可 以 实现 货物 原子 性 和 已 认证 交付 。 例 如 ，C 有 一 个 规定 的 检查 时 间 来 确定 
所 交付 的 货物 是 否 是 其 订购 的 货物 。 与 原先 的 货物 原子 性 协议 一 样 ， 这 个 协议 也 是 依靠 某 个 
受 C 和 M 都 信任 的 第 三 方 ， 在 该 事务 提交 之 后 完成 某 个 规定 的 操作 。 


27.7.4 电子 现金 ; 盲 签名 
我 们 迄今 所 讨论 的 因特网 采购 事务 都 是 使 用 某 种 信用 卡 ， 信 用 卡 (包括 支票 ) 是 符号 货 


O 我们 所 描述 的 协议 是 建立 在 -Escrow 协 议 [-Escrow 2000] 基 础 上 的 。 

O MHj 以 检测 返 同 的 货物 ， 以 查看 它们 是 否 是 所 发 送 的 ， 并 且 必 须 在 某 个 规定 的 检查 时 间 内 完成 其 检测 。 我 
们 忽略 了 若 M 对 返回 的 货物 不 满意 时 会 发 生 的 情况 。 

© 在 步 又 4 中 M 可 能 没有 发 送 货物 给 C， 也 有 可 能 在 步 邓 5bi 中 C 没 有 将 货物 返回 给 E。 再 说 明 一 次 ， 这 些 情况 
可 以 通过 货运 代理 的 追踪 机 制 来 解决 。 





认 ) 的 一 一 货 
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i (notational money) 的 一 个 例子 。 也 就 是 说 ， 你 实际 的 财富 是 通过 银行 账户 中 的 余额 来 
表示 的 ; 你 的 信用 卡 (或 者 支票 ) 就 是 相对 于 那些 财富 的 一 种 符号 。 当 进行 某 项 采购 的 时 
候 ， 你 提供 了 一 个 符号 来 标识 你 和 你 正在 采购 的 货物 的 价值 。 零 售 商 相信 你 会 遵循 该 采购 
协定 ， 并 最 终 会 用 实际 的 货币 支付 这 次 采购 (在 你 的 支票 账户 中 有 足够 的 资金 ， 或 者 你 在 
信用 卡 公司 具有 和 良好 的 信誉 ) 。 无 论 是 哪 一 种 情况 ， 你 的 银行 余额 最 终 会 减少 ， 以 反映 出 你 
的 采购 。 . 

与 符号 化 货币 不 同 ， 现 金 是 由 政府 支持 的 。 虽 然 它 并 没有 真实 的 价值 (毕竟 ， 那 只 是 一 
张 纸 而 已 ) ; 但 是 公众 对 政府 的 稳定 性 的 信任 会 导致 它 好 像 是 有 真实 价值 那样 (an, 
它 是 金子 一 样 )。 因 此 ， 和 零售 商 知道 ， 他 完全 可 以 将 现金 存 人 其 账户 里 ， 或 者 用 它 来 采购 其 他 
的 货物 ， 而 无 需 信 任 该 顾客 。 现 金 通常 称 作 令 牌 货币 (token money )。 在 因特网 世界 里 ， 仿 
牌 货币 就 是 电子 化 (electronic) 或 数字 化 (digital) 的 现金 。 

令 牌 货币 向 某 个 事务 的 参与 者 提供 了 超越 符号 化 货币 的 优势 。 

“匿名 性 ”由 于 不 需要 顾客 提供 任何 签名 记录 来 完成 某 项 现金 事务 ， 所 以 事务 可 以 匿名 地 

进行 。 银 行 和 信用 卡 公司 都 不 知道 该 顾客 的 身份 。 相 反 ， 信 用 卡 公司 则 保存 着 所 有 顾客 

的 采购 记录 ， 而 银行 也 可 以 访问 作废 的 支票 。 在 稍 后 的 某 个 时 间 ， 这 些 记录 可 能 用 于 政 

府 、 某 个 法 庭 程序 等 方面 。 

* 小 额 采 购 ”对 于 每 一 项 信用 卡 事务 ， 信 用 卡 公司 要 在 固定 费用 的 基础 上 根据 采购 金额 加 

收 一 定 的 手续 费用 。 因 此 ， 信用卡 对 于 那些 只 涉及 少量 金额 的 采购 是 不 合适 的 ， 但 仍 有 

些 因特网 供应 商会 为 提供 给 浏览 者 的 一 页 消息 而 收取 几 分 钱 。 小 额 的 电子 现金 对 于 这 样 

的 事务 很 有 用 处 。 

因此 有 必要 支持 建立 在 电子 现金 基础 上 的 事务 。 这 样 的 事务 应 当 满 足 货币 原子 性 (money 
atomicity) 的 需求 : 货币 不 应 该 被 创造 或 销毁 。 然 而 ， 由 于 电子 现金 在 系统 中 是 通过 某 个 数 
据 结构 来 代表 的 ， 所 以 可 能 存在 几 种 违反 货币 原子 性 的 情况 。 例 如 : 

“ 一 个 不 诚实 的 客户 或 零售 商 可 能 会 制作 该 数据 结构 的 一 份 捞 贝 ， 并 同时 使 用 原始 的 数据 

结构 和 拷贝 。 

* 若 出 现 故障 〈 例 如， 丢失 了 某 个 消息 或 者 系统 骨 泪 了 ) ， 则 货币 就 可 能 被 创造 或 销 贷 。 

例如 ,一 个 将 数据 结构 拷贝 发 送 给 零售 商 的 顾客 , 无 法 确认 零售 商 是 否 接收 到 这 条 消息 ， 

所 以 决定 在 另 一 次 采购 中 重复 使 用 该 数据 结构 一 一 尽管 实际 上 已 收 到 资金 。 另 外 ， 有 可 

能 消息 还 没有 接收 到 ， 但 该 客户 已 不 再 使 用 此 数据 结构 了 ， 因 为 顾客 并 没有 意识 到 此 项 

付款 尚未 完成 。 

下 面 将 讨论 用 来 支持 任意 (未 必 是 电子 化 ) 货物 采购 的 电子 化 现金 协议 。 货 物 原子 性 并 
不 是 这 种 协议 的 一 个 特点 。 相 反 地 ， 顾 客 相信 零售 商会 在 事务 提交 之 后 发 送 货物 。 

1. 令 牌 与 宛 余 谓词 

本 协议 是 建立 在 Ecash 协 议 [Chaum et al. 1988] 基 础 上 的 。 现 金 用 各 种 单位 的 电子 令 牌 来 代 
表 。 每 张 令 牌 都 由 用 银行 才 知 道 的 某 个 私 钥 加 过 密 的 唯一 序列 号 m 组 成 。 这 里 的 术语 容易 令 人 
困惑 ， 因 为 我 们 经 常 说 到 ， 在 电子 化 现金 协议 中 ， 银 行 通过 “签署 ”序列 号 来 创建 令 牌 。 这 
里 的 签名 的 意思 与 27.3 节 中 签名 的 意思 是 不 一 样 的 ， 后 一 种 签名 由 被 签名 项 紧 随 一 个 对 其 搞 
要 的 加 密 项 组 成 。 在 本 节 中 ， 当 我 们 说 银行 签署 了 某 个 序列 号 时 ， 意思 是 指 银行 用 某 个 私 钥 








加 密 了 此 序列 号 ， 而 产生 的 结果 则 是 一 张 令 牌 。 

这 种 方案 如 何 防 止 人 侵 者 创建 伪造 令 牌 呢 ? 毕竟 ， 令 牌 只 不 过 是 具有 一 定 长 度 的 比特 串 
而 已 。 该 比特 串 是 对 某 个 序列 号 进行 加 密 而 得 到 的 事实 ， 并 不 能 提供 这 种 保护 。 你 可 能 会 认 
为 ， 我 们 可 以 通过 用 银行 的 公 钥 对 它 解密 ， 并 检验 结果 的 方法 来 测试 该 令 牌 的 真实 性 。 然 而 ， 
那个 密 钥 可 能 会 应 用 到 任何 有 效 的 或 无 效 的 令 牌 ， 产生 比特 串 ， 而 我 们 没有 任何 办 法 来 辨别 
菜 个 比特 串 是 有 效 的 序列 号 还 是 无 效 的 序列 号 。 

为 了 防止 入侵 者 创建 伪造 的 令 牌 ， 我 们 采用 一 种 技术 ， 它 要 求 将 序列 号 变 成 具有 某 种 特 
点 的 比特 串 ， 从 而 使 得 它们 可 以 和 任意 的 比特 串 区 分 开 来 。 例 如 ， 它 可 能 要 求 序 列 号 的 前 半 
部 分 应 该 是 随机 地 创建 的 ， 而 后 半 部 分 则 应 该 是 前 半 部 分 利用 某 种 固定 的 、 已 知 的 编码 函数 
来 编码 的 形式 。 形 式 上， 我 们 说 ， 存 在 一 些 众所周知 的 谓词 ， 称 为 宛 余 谓词 (redundancy 
predicate) valid， 使 得 对 于 所 有 有 效 的 序列 号 xn， 其 谓词 valid(n) 都 为 真 。 

尽管 我 们 假设 伪造 者 也 知道 元 余 谓词 和 银行 解密 令 牌 的 公 钥 ， 但 他 并 不 知道 银行 的 私 钥 ， 
所 以 无 法 通过 加 密 某 个 有 效 的 序列 号 来 产生 出 令 牌 。 因此， 在 伪造 令 牌 时 ， 他 面临 着 需要 寻 
找到 一 张 ( 假 的 ) 令 牌 ,使 其 解密 得 到 的 比特 串 能 满足 valid 的 问题 。 伪 造 者 可 以 采用 尝试 -出 
错 技术 来 完成 这 一 工作 ， 但 是 解密 一 个 任意 选择 的 比特 串 ， 其 结果 会 满足 valid 的 可 能 性 是 极 
小 的 ， 若 该 比特 串 足够 长 ， 或 者 valid 使 得 满足 valid 的 比特 串 仅 占 所 有 该 长 度 比 特 串 总 数 的 很 
小 一 部 分 的 话 。 

在 创建 令 牌 的 方案 中 ， 银 行 保持 有 一 系列 的 公 钥 / 私 钥 对 ， 并 选择 满足 ralid 的 序列 号 。 它 
在 该 系列 中 ， 用 同一 把 私 钥 Kf” 来 签署 所 有 用 于 创建 某 个 特定 单位 j 的 序列 号 ,而 对 于 不 同 的 
单位 则 采用 不 同 的 私 钥 。 银 行 并 不 持 有 其 创建 令 牌 的 序列 号 的 列表 ， 然 而 ， 如 果 数 量 足 够 大 ， 
并 对 每 种 单位 允许 铸造 的 令 牌 数 量 有 所 限制 的 话 ， 那 么 银行 会 两 次 选择 相同 的 序列 号 的 可 能 
性 就 会 缩 到 很 小 。 银 行 持 有 所 有 已 储存 令 牌 的 序列 号 的 一 份 列 表 ， 因 此 可 以 拒绝 任何 已 储存 
的 令 牌 的 拷贝 。 通 过 这 种 方法 ， 它 就 可 以 侦 测 到 试图 使 用 某 个 复制 令 牌 的 企图 。 任 何 客户 或 
零售 商 ， 都 可 以 通过 用 KY 解密 ， 并 对 其 结果 应 用 vailid 的 方法 ， 来 检查 某 张 令 牌 的 真实 性 及 
其 单位 。 

2. 简单 数字 化 现金 协议 

如 果 匿 名 性 不 成 问题 ， 那 么 客户 C、 零 售 商 M 和 银行 B 就 可 以 采用 如 下 的 简单 数字 化 现金 
协议 。 

(1) 创建 令 牌 

1) C 向 B 认 证 他 的 身份 ， 并 发 送 一 条 消息 ， 请 求 以 令 牌 形式 从 C 的 账户 提取 一 定数 额 的 
现金 。 

2) B 在 C 的 账户 上 记 入 借方 ， 然 后 通过 建立 某 个 序列 号 a 来 铸造 所 要 求 的 令 牌 ， 对 于 每 一 
张 令 牌 ,使 得 valiad(ni) 为 真 。 然 后 ， 与 该 令 牌 的 单位 j 相 对 应 ， 用 私 钥 I” 来 加 密 n;， 从 而 产生 
令 牌 KP" Tn) 。 

3) B 向 C 发 送 用 会 话 密 钥 (为 供 B 和 C 在 通常 情况 下 使 用 而 生成 的 ) 加 密 的 令 牌 。 任 何 令 
牌 都 不 能 以 未 加 密 形式 发 送 ， 因 为 每 个 人 侵 者 都 可 能 会 拷 足 它 ， 并 在 C 尚 未 消费 原始 的 令 牌 之 
前 就 消费 掉 该 拷贝 。( 在 这 种 情况 下 ， 当 C 在 后 来 存款 上 时， 原始 的 令 牌 反而 会 遭 到 B 的 拒绝 。) 
这 时 ， 提 交 此 创建 令 牌 事务 。 
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4) C 接 收 到 此 令 牌 ， 并 将 其 储存 在 他 “电子 钱包 ”里 。 

(2) 消费 令 牌 

1) 当 C 想 要 采用 他 的 一 些 令 牌 从 M 处 采购 货物 的 时 候 ， 他 先 与 M 建 立 一 次 会 话 ， 并 按 常规 
方式 产生 一 把 会 话 密 钥 。 然 后 他 向 M 发 送 包含 货物 的 采购 订单 和 相应 的 令 牌 号 码 的 一 条 消息 ， 
所 有 的 通信 都 用 会 话 密 钥 进行 了 加 密 。 

2) 当 接 收 到 了 来 自 于 C 的 消息 ，M 解 读 此 令 牌 并 检查 它们 是 否 有 效 ， 是 否 足 够 用 于 采购 所 
要 求 的 货物 。M 然 后 用 会 话 密 钥 加 密 此 令 牌 后 转发 给 B。 

3) 当 收 到 来 自 于 M 的 消息 后 ; B 解 读 此 令 牌 并 检查 它们 是 否 有 效 。 然 后 它 检查 其 所 存储 的 
令 牌 列表 ， 以 此 来 确定 所 接收 到 的 令 牌 尚未 存储 过 。 然 后 B 将 刚才 收 到 的 令 牌 添加 到 其 存储 的 
令 牌 列表 中 ， 对 M 账 户 增加 此 令 牌 之 金额 数 ， 提 交 该 事务 并 向 M 发 送 一 条 完成 消息 。 

4) 一 旦 收 到 B 的 完成 消息 ，M 便 执行 本 地 提交 操作 ， 然 后 向 C 发 送 一 条 完成 消息 (及 已 采 
购 的 货物 )。 

该 协议 并 未 确保 货物 原子 性 或 已 认证 交付 。M 可 能 并 没有 癌 C 发 送 货物 。 

正如 SET 协议 一 样 ， 在 B、M 和 C 之 间 的 消息 交换 可 以 看 成 是 一 种 线性 提交 协议 。 

3. 匿名 协议 和 言 函数 

简单 数字 化 现金 协议 并 未 向 客户 提供 匿名 性 ， 因 为 银行 能 够 记录 顾客 取款 用 的 令 牌 的 序 
列 号 。 当 那些 令 牌 被 某 个 零售 商 存储 时 ， 银 行 可 以 得 出 结论 : 该 零售 商 卖 给 了 那个 顾客 一 些 
货物 。 这 就 透露 出 了 有 关 那 个 顾客 的 行动 的 一 些 消 息 ， 而 他 本 人 可 能 并 不 想 让 人 知道 这 些 事 
情 。 为 了 提供 匿名 性 ， 协 议 改 为 由 顾客 (而 不 是 银行 ) 来 产生 序列 号 4a， 使 之 满足 valid(n)， 
对 它 编 码 ， 然 后 将 它 提交 给 银行 。 银 行 采用 某 个 对 应 于 所 取款 的 令 牌 单位 的 私 钥 ， 签 署 已 编 
码 的 序列 号 ( 它 并 不 知道 此 序列 号 是 什么 )， 创 建 令 牌 。 这 样 一 种 签名 称 为 讶 签名 (blind 
signature) [Chaum et al. 1988]。 银 行 并 不 知道 该 序列 号 ， 所 以 当 该 令 牌 稍 后 再 由 零售 商 存 储 
时 ， 它 并 不 能 回溯 出 其 顾客 。 当 顾客 从 银行 收 到 宦 令 牌 时 ， 便 将 它 还 原 ， 以 获得 原 令 牌 。 

为 了 实现 宵 签 名 ， 该 协议 采用 讶 函数 (blinding function) b， 它 有 了 时候 称 为 兑换 函数 
(commuting function), HALDANE Bab Aan PATE. 

° EDMEE EN. 

“8 可 与 银行 所 采用 的 一 一 涉及 (秘密 的 ) 单位 密 钥 K” ma RET a. B 

K?” [b(n)] = (天 后 [Im]) 





作为 结果 ， 有 
b7! (KP” [b(n)}) =b" (2 人 (KE [n})] = Kr [n] 


tk, CHAAR S eb Se ne. 

创建 令 牌 

1) C 创 建 一 个 满足 valid(n) 的 有 效 序列 号 n。 

2) C 选 择 一 个 盲 函数 b ( 仅 有 C 知 道 )， 并 通过 计算 b(n) 来 盲 化 (blind) 此 序列 号 。 

3) C 疝 B 认 证 自己 的 身份 ， 并 发 送 一 条 包含 b(n) 的 消息 ， 请 求 从 他 的 账户 中 以 令 牌 的 形式 
提取 一 定数 额 的 现金 。( 和 在 简单 数字 化 现金 协议 中 一 样 ， 该 消息 是 用 会 话 密 钥 加 密 了 的 。) 





704 ORD FFAS 


由 于 B 不 知道 宦 函 数 ， 所 以 它 无 法 确定 n。 | 
4) 对 应 于 该 令 牌 的 单位 ，B 用 私 钥 K” RE Bon), ， 创 建 宵 令 牌 K” [b(n)]。 它 相应 地 向 
C 的 账户 记 入 借方 ， 并 再 次 采用 会 话 密 钥 向 C 返 回 该 盲 令 牌 。 尽 管 B 无 法 检验 C 确 实 选 出 了 一 个 
有 效 的 序列 号 (满足 valid(n)), 但 C 没 有 任何 理由 去 创建 一 个 无 效 的 号 码 ， 因 为 C 知 道 ， 当 他 
试图 消费 它 的 时 候 ，B 会 将 该 令 牌 的 金额 数 记 和 人 他 账户 的 借方 ， 而 爱 令 牌 的 有 效 性 也 将 会 受到 
检验 。 这 时 ， 提 交 该 令 牌 创建 事务 。 
5) C 通 过 使 用 b'(KP"[b(n)]) 5 (unblind) F$, ZK K?”[n] ， 这 就 是 其 请 求 的 
由 某 个 已 签名 的 有 效 序列 号 所 组 成 的 令 牌 。 
4. 创建 谨 函 数 
协议 要 求 C 创 建 他 自己 的 〈B 不 知道 的 ) 请 函数 上 。 这 似乎 是 一 项 很 困难 的 任务 ， 但 对 于 
公 铀 加 密 来 说 ， 这 很 容易 在 RSA 算 法 语 境 下 实现 。 在 完成 此 任务 的 一 个 方案 中 ，C 首 先 产 生 某 
个 随机 数 x， 它 与 银行 密 钥 的 模 N 是 互 素 的 9 (参见 27.2 节 )。 因 为 x 与 N 是 互 素 的 ， 所 以 它 相对 
于 N 有 一 个 乘 性 逆 (multiplicative inverse) ux-!1， 使 得 
uxu'=1(mod N) 
AT HFI Sn, Cth 
K”? [u] « n (mod N) 
并 将 其 结果 发 送 给 B。 因 此 ， 宣 函数 可 以 被 简单 地 看 成 乘 以 某 个 随机 数 。 
由 B 返 回 给 C 的 已 签名 的 结果 sr 是 
sr= Kr”[K?*[ul « n] 


根据 式 (27.1)， 可 推出 
sr=u* K?"[n](mod N) 
通俗 地 讲 ， 我 们 可 以 把 复明 令 牌 C 说 成 是 “用 x 去 除 sr”， 但 实际 上 ，C 是 通过 乘 以 其 乘 性 
逆 来 复明 该 令 牌 的 : 
K?"[n] =u" « sr (mod N) 


现在 就 可 以 通过 K ”获得 序列 号 mn。 

5. 消费 令 牌 

消费 和 验证 令 牌 的 协议 涉及 和 先前 叙述 的 简单 协议 一 样 的 处 理 步骤 。 幸 运 的 是 ， 我 们 不 
必 假 设 B 持 有 其 所 产生 令 牌 的 系列 号 的 一 份 列 表 ， 因 为 在 匿名 协议 中 ， 它 确实 不 知道 这 些 序列 
号 是 什么 。 当 M 向 B 提 交 该 令 牌 要 求 展 约 时 ，B 总 是 简单 地 假定 如 果 该 序列 号 满足 ralid， 那 么 
它 较 快 地 〈 宣 目地 ) 签署 那个 序列 号 。 与 以 前 一 样 ，B 持 有 已 存储 令 牌 的 序列 号 的 一 份 列表 ， 
所 以 它 不 会 重复 接收 同样 的 令 牌 。 

6. 货币 原子 性 

问题 是 该 电子 化 现金 协议 是 否 达到 了 货币 原子 性 。 货 币 原子 性 有 两 个 方面 : 

1) 若 某 个 进程 能 够 产生 某 个 令 牌 的 一 份 拷贝 ， 并 随后 消费 它 的 话 ， 货 币 是 有 可 能 (在 任 


但”Euclid 的 算法 可 以 用 来 测试 该 随机 数 是否 与 N 互 素 ( 见 [Stalling 1997])。 
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何事 务 之 外 ) 创建 出 来 的 。 然 而 ， 当 银行 检测 出 序列 号 与 其 先前 提交 的 令 牌 的 列表 不 相符 时 ， 
就 会 发 现 这 一 欺骗 的 企图 。 创 建 货 币 的 另 一 种 方法 是 伪造 ， 但 是 ， 就 像 我 们 先前 所 看 到 的 一 
样 ， 这 种 方法 也 是 不 可 能 成 功 的 。 
2) 货币 也 有 可 能 因为 故障 而 销毁 ， 但 是 这 样 的 问题 一 般 也 是 可 以 处 理 的 。 
。 在 令 牌 生成 事务 中 ， 银 行 会 记 入 该 客户 账户 的 借方 ， 发 送 此 令 牌 ， 然 后 提交 。 但 通信 
系统 则 丢失 了 此 令 牌 ， 并 且 它 从 不 交付 给 顾客 。 不 过 ， 这 些 协 议 有 一 个 有 趣 的 性 质 ， 
如 果 顾 客 声 称 从 未 收 到 过 银行 发 送 的 某 个 令 牌 ， 那 么 银行 可 以 很 简单 地 向 此 顾客 发 送 
EXER ABBR (H) 令 牌 的 一 份 拷贝 。 即 便 该 顾客 是 不 诚实 的 ， 他 现在 拥有 该 
令 牌 的 两 份 拷贝 ， 但 是 他 只 能 够 消费 一 个 。 
。 在 令 牌 消费 事务 中 ， 当 某 顾客 发 送 了 令 牌 、 但 尚未 接收 到 该 事务 提交 消息 时 ， 系 统 出 
现 了 月 省。 顾客 并 不 知道 事务 是 否 在 崩溃 之 前 提交 ， 因 此 也 不 知道 该 令 牌 是 否 实际 消 
费 了 。 倘 车 顾 客 试 图 再 次 消费 令 牌 时 ， 就 可 能 被 怀疑 欺诈 。 然 而 ， 顾客 可 以 稍 后 询问 
银行 ， 是 否 已 消费 了 某 个 特定 的 令 牌 〈 即 在 已 消费 令 牌 的 列表 中 )， 但 是 这 样 会 破坏 
该 顾客 的 匿名 性 。 


27.8 参考 书目 


[Stallings 1999] 中 涵盖 了 本 章 的 绝 大 部 分 内 容 。 公 钥 加 密 的 概念 是 由 [Diffie and Hellman 1976] 首 先 
提出 的 ， 但 几乎 所 有 的 公 钥 加 密 系 统 都 是 建立 在 RSA 算 法 [Rivest et al. 1978] 基 础 上 的 。[Schneier 1995] 
对 RSA 算 法 以 及 其 他 许多 加 密 算法 与 协议 的 数学 基础 进行 了 详细 的 描述 。 与 公 钥 加 密 类 似 ， 数 字 签 名 的 
概念 也 是 在 [Diffie and Hellman 1976] 中 引进 的 ， 但 虽然 大 多 数 数 字 签 名 系统 都 是 建立 在 RSA 算 法 [Rivest 
et al. 1978] 基 础 上 的 ， 但 还 是 有 些 系统 是 建立 在 专门 为 数字 签名 而 开发 的 其 他 算法 基础 上 的 ， 它 们 不 适 
合用 于 加 密 。Kerberos 系 统 是 在 [Steiner et al. 1988] 和 [Neuman and Ts'o 1994] 里 讨论 的 ， 它 形成 了 
DCE[Hu 1995] 中 提供 的 安全 性 的 基础 。NetBill 系 统 是 在 [Cox et al. 1995] 里 介绍 的 。[Chaum et al. 1988] 
介绍 了 Ecash 协 议和 育 签 名 。SSL 和 SET 协议 的 描述 可 在 Web 的 相关 网 站 上 找到 ， 按 照 公布 时 间 ，SSL 见 
[Netscape 20001]，SET 见 [VISA 2000]。 托管 代理 协议 是 建立 在 通过 eBay 提供 的 i-Escrow 系 统 基 础 上 的 ， 
按照 公布 时 间 ， 在 其 Web 网 站 [i-Escrow 2000] 上 有 描述 。 


27.9 练习 


27.1 请 讨论 在 因特网 上 运行 事务 时 所 涉及 的 安全 性 问题 。 
27.2 任何 采用 计算 机 键盘 的 人 ， 应 当 都 能 解决 下 述 简单 的 替换 密码 : 
Rsvj ;ryyrt od vjsmhrf yp yjr pmr pm oyd tohjy pm yjr lrunpstf/ 

27.3 请 说 明 ， 为 什么 一 般 短 密 钥 的 安全 性 低 于 长 密 钥 ? 

27.4 为 什么 在 Kerberos 协 议 里 ， 从 KS 向 C 发 送 的 消息 ( 即 消 息 M2) 里 必须 包含 S? 并 请 描述 ， 倘 若 不 
包含 S$， 可 能 被 I 利用 的 一 种 攻击 。 

27.5 请 说 明 ， 如 何在 安全 性 协议 里 用 时 间 翼 来 防止 某 个 回放 攻击 。 

27.6 请 说 明 ， 在 对 短 销 息 或 者 对 字段 内 包含 着 人 侵 者 可 能 熟悉 的 明文 进行 加 密 时 ， 如 何 利用 临时 串 来 
提高 安全 性 。 

27.7 在 采用 公 钥 加 密 的 系统 里 ， 站 点 B 打 算 通 过 假冒 A 来 轧 弄 C。B 等 竺 着， 直到 A 请 求 与 B 通 信和 为 止 。 
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27.8 


27.9 


27.10 


27.11 


27.12 


27.13 


27.14 
27.15 
27.16 
27.17 
27.18 
27.19 


27.20 


A 是 通过 向 B 发 送 一 条 “我 想 要 通信 ”的 消息 而 做 到 这 点 的 ， 该 消息 指出 其 名 字 (A)， 并 采用 B 的 公 

钥 加 密 。 然 后 B 突 然 提 出 陷阱 。 他 向 C 发 送 一 条 “我 想 要 通信 ”的 消息 ， 声 称 他 是 A， 并 采用 C 的 

公 和 钥 进 行 加 密 。 为 了 弄 清 是 否 确实 在 与 A 通信 ，C (向 B) 回 复 了 一 个 通过 对 某 个 大 随机 数 N 用 A 的 公 

钥 加 密 而 获得 的 一 段 消息 。 如 果 C 得 到 的 是 包含 着 用 C 的 公 钥 加 密 的 数 N+1 的 消息 ， 他 就 会 得 出 对 

方 为 A 的 结论 ， 因 为 只 有 A 才能 解读 C 发 送 的 消息 。C 确 实 得 到 了 这 样 的 响应 。 然 而 ， 这 是 错误 的 ， 

因为 响应 来 自 B。 请 说 明 ， 这 是 怎么 发 生 的 ? (提示 : 如 果 每 个 消息 的 密 文 都 包含 发 送 者 的 名 字 的 

话 ， 该 协议 就 可 以 被 校正 。) 

假设 入 侵 者 获得 了 某 零 售 商 证书 的 一 份 拷贝 。 

a. 请 说 明 ， 为 什么 该 人 侵 者 不 能 轻易 地 利用 该 证 书 ， 并 冒充 他 是 零售 商 ? 

b. 请 说 明 ， 为 什么 人 侵 者 不 能 用 自己 的 公 钼 取代 零售 商 在 证 书 里 的 公 铀 ? 

假设 你 采用 了 SSL 协 议 ， 并 与 某 零售 商 站 点 M 相 连接 。 该 站 点 向 你 发 送 M 的 证 书 。 当 SSL 协 议 完成 

时 ， 如 何 才 能 确定 新 的 会 话 密 钥 只 有 M 知 道 (也许 是 某 个 人 侵 者 向 你 发 送 的 M 证 书 的 拷贝 ) ? 如 

何 能 确保 确实 连接 到 了 M3? 

利用 你 的 本 地 因特网 浏览 器 : 

a. 请 描述 ， 当 你 与 某 个 站 点 相连 接 时 ， 如 何 告知 对 方正 在 采用 SSL 协 议 ? 

b. 假设 你 已 经 与 一 个 采用 SSL 的 站 点 相连 接 。 请 描述 ， 如 何 确定 提供 该 站 点 证 书 的 CA 的 名 字 ? 

c. 你 的 浏览 器 为 SSL 加 密 所 用 的 密 钥 是 多 少 位 的 ? 

假设 你 得 到 了 自己 的 证 书 。 请 说 明 ， 如 何 采 用 该 证 书 来 处 理 某 个 人 侵 者 可 能 偷 走 了 你 的 信用 卡号 

码 的 情况 ? 

假设 某 个 人 侵 者 将 病毒 放 到 电脑 里 ， 从 而 改变 了 你 的 浏览 器 设置 。 请 描述 ， 该 人 侵 者 可 能 冒充 你 

打算 与 之 通信 的 某 台 服务 器 站 点 S (哪怕 你 采用 了 SSL 协 议 ) 并 获得 你 的 信用 卡号 码 的 两 个 不 同 

办 法 。 

一 个 采用 SSL 协 议 〈 不 带 SET) 的 零售 商 可 以 通过 如 下 过 程 实现 信用 卡 交易 : 客户 采购 某 项 物品 ， 

而 零售 商 要 求 他 用 在 SSL 协 议 里 创建 的 会 话 密 钥 将 其 信用 卡号 码 加 密 后 发 送 过 来 。 当 零 售 商 接收 

到 此 信息 后 ， 他 便 与 信用 卡 公司 开始 一 个 单独 的 事务 ， 以 验证 该 次 采购 。 当 该 事务 需要 提交 时 ， 

零售 商 就 与 顾客 一 起 提交 该 事务 。 请 说 明 ， 这 个 协议 与 SET 之 间 的 异同 。 

假设 SET 协议 里 的 零售 商 是 不 诚实 的 。 请 说 明 ， 他 为 什么 无 法 欺骗 顾客 ? 

请 说 明 ， 为 什么 在 已 认证 交付 协议 中 需要 采用 某 个 可 信任 的 第 三 方 ? 

请 描述 零售 商 电 脑 可 以 用 来 处 理 SET 协 议 中 出 现 崩 溃 情 况 的 重启 动 处 理 步 又 。 

请 说 明 ， 为 什么 SET 协 议 中 的 MD，( 见 27.7.2 节 ) 必须 是 对 偶 签 名 的 一 部分? 

请 说 明 ， 为 什么 伪造 者 不 能 轻易 地 提交 一 个 任意 随机 数 ， 将 它 作为 电子 化 现金 协议 的 令 牌 ? 

假设 在 匿名 电子 化 现金 协议 里 的 银行 是 诚实 的 ， 但 客户 和 零售 商 不 一 定 诚实 。 

a. 在 接收 到 银行 的 令 牌 后 ， 顾 客 声称 他 从 未 收 到 过 此 令 牌 。 请 说 明 ， 银 行 应 当 如 何 做 ? 为 什么 这 
样 做 是 正确 的 ? 

b. 在 从 顾客 处 接收 到 包含 采购 订单 和 客户 令 牌 的 消息 之 后 ， 堆 售 商 声称 从 未 接收 到 此 类 消息 。 请 
说 明 ， 客 户 应 当 如 何 做 ? 为 什么 ? 

请 描述 ， 以 下 的 每 个 协议 为 防止 同 放 玫 击 所 采用 的 方法 : 

a. Kerberos 认 证 协议 

b. SET 协 议 

c. 电子 化 现金 协议 
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附录 A 关于 系统 的 问题 


A.1 基本 系统 问题 


事务 处 理 系统 既 可 以 在 单 台 计算 机 上 实现 ， 也 可 以 在 许多 地 理 上 广阔 分 布 的 计算 机 上 实 
现 。 事 务 既 可 以 访问 同一 台 计 算 机 上 的 单个 (本 地 ) 数据 库 ， 也 可 以 访问 另外 半球 上 的 许多 
(远程 ) 数据 库 。 但 是 无 论 如 何 ， 事 务 都 必须 支持 ACID 性 质 。 在 这 一 节 中 ， 我 们 回顾 设计 这 
类 系统 的 一 些 基 本 概念 和 机 制 。 


A.1.1 模块 和 对 象 


多 数 大 型 系统 都 采用 “分 而 治之 ”的 方法 进行 设计 。 系 统 被 分 解 为 一 些 简单 的 、 可 以 
单独 实现 与 调试 的 模块 。 支 持 模 块 结构 的 程序 设计 语言 允许 程序 员 指定 模块 接口 和 模块 体 。 
模块 M1 的 接口 (interface) 包含 M2 模 块 访 问 M1 所 需要 的 全 部 信息 。 它 包括 M1 中 可 以 被 
M2 调用 的 过 程 名 ， 以 及 它们 的 参数 和 类 型 ， 上 述 内 容 组 成 了 调用 语句 的 语法 (有 时 也 称 
为 过 程 的 签名 (signature ) ) 。 接 口 还 应 该 包含 语义 信息 : 每 个 过 程 作用 的 描述 (可 能 是 文 
FAY). 

接口 可 作为 模块 的 实现 者 和 它 的 用 户 之 间 的 一 个 契约 。 实 现 者 保证 模块 符合 接口 中 包含 
的 规范 。 当 M 1 为 应 用 级 的 程序 提供 服务 时 ， 它 的 接口 通常 称 为 应 用 编程 接口 (Application 
Programming Interface，API)。 图 A-1 给 出 了 这 种 情形 。 


MI1 隐 含 的 体 一 








”基于 M1 的 接 
日 访问 M1 





f 
MI 的 输出 接口 


图 A-1 模块 结构 
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接口 也 包含 向 调用 者 返回 错误 情况 的 机 制 的 描述 。 这 些 情 况 在 事务 处 理 系 统 中 频繁 发 生 。 
例如 ， 当 M2 调用 M1 时 ，M1 可 能 还 没有 初始 化 ， 或 提供 给 M1 的 自 变 量 发 生 错 误 。 

模块 体 (body) 包含 可 以 被 其 他 模块 调用 的 过 程 ， 仅 供 内 部 使 用 的 过 程 ， 以 及 变量 声明 。 
M1 的 接口 可 以 在 模块 体 的 实现 和 存储 入 库 之 前 进行 设计 。M1 的 接口 规范 与 模块 体 的 实现 分 
离 所 带 来 的 便利 是 ， 调 用 M1 的 模块 可 以 仅 根据 该 接口 进行 设计 和 实现 (甚至 部 分 调试 )。 这 
样 ，M1 和 M2 的 实现 就 可 以 并 行进 行 。 

每 个 模块 的 体 对 其 他 模块 来 说 是 隐藏 的 。 有 时 我 们 也 说 过 程 和 变量 的 声明 封装 
(encapsulated) 到 模块 中 。 所 以 ，M1 的 模块 体 可 以 随时 重新 实现 ， 只 要 它 的 接口 仍 保持 不 变 ， 
M2 就 无 需 改变 。 这 种 性 质 通常 称 为 实现 透明 性 (implementation transparency )。 模 块 体 中 的 
变量 声明 对 于 MI 的 过 程 是 全 局 性 的 。 与 局 部 变量 不 同 ， 全 局 变量 具有 持久 性 ， 并 在 不 同 的 调 
用 间 保 持 它们 各 自 的 值 。 全 局 变量 的 值 构 成 模块 的 状态 (state )。 

实现 的 透明 性 意味 着 模块 的 用 户 无 需 关注 模块 提供 的 服务 是 如 何 实现 的 。 而 且 ， 模 块 的 
用 户 不 能 有 意 或 无 意 地 破坏 模块 体 中 声明 的 变量 的 完整 性 ， 因 为 它们 不 能 直接 访问 这 些 变量 。 
用 户 通过 调用 接口 过 程 可 以 间接 影响 这 些 变量 的 状态 ， 而 那些 过 程 会 保持 数据 的 完整 性 。 

模块 的 思想 可 以 进一步 改进 ， 从 而 产生 对 象 的 概念 。 对 象 (object) 是 一 组 应 用 中 有 意义 
的 某 个 实体 的 计算 机 表示 ， 例 如 ， 一 个 下 压 堆 栈 ， 或 表单 上 由 图 片 表 示 的 一 个 按钮 ， 该 按钮 
可 作为 事务 处 理 系统 的 图 形 界面 的 一 个 组 成 部 分 。 

对 象 由 一 组 属性 (attribute) 和 方法 (method) 来 刻画 ， 这 些 属性 的 值 组 成 了 对 象 的 状态 ， 
而 在 对 象 接口 中 描述 的 这 些 方法 是 一 些 能 够 被 其 他 模块 调用 的 过 程 。 一 个 按钮 的 属性 可 能 包 
含 它 的 尺寸 、 位 置 和 颜色 。 与 按钮 对 象 相关 的 方法 可 能 包含 在 屏幕 上 绘制 按钮 的 图 形 表示 的 
过 程 ， 以 及 当 用 户 按 下 按钮 后 改变 按钮 表示 的 过 程 。 过 程 和 属性 编码 的 数据 结构 都 封装 在 对 
RAR. 

一 些 属性 是 公共 的 (public)， 并 且 可 以 从 对 象 外 部 通过 常用 的 赋值 语句 进行 访问 。 例 如 ， 
一 个 时 钟 对 象 可 能 产生 可 以 直接 被 外 部 程序 读 取 的 存储 当前 时 间 的 变量 。 另 外 一 些 属 性 则 是 
私有 的 (private ) ， 并 且 只 能 被 公共 对 象 方法 访问 。 例 如 ， 按 钮 对 象 搜 有 一 组 与 它 的 图 形 显示 
有 关 的 私有 属性 ， 这 些 属性 被 绘制 在 屏幕 上 显示 按钮 的 方法 所 使 用 。 由 于 用 户 不 能 访问 这 些 
私有 属性 ， 所 以 显示 的 完整 性 就 不 会 遭 到 破坏 。 

一 个 给 定 的 应 用 可 能 包含 许多 相似 的 对 象 ， 如 按钮 ， 这 些 对 象 具 有 同样 的 属性 和 方法 。 
它们 是 对 象 类 (object class), MAE (class) 的 实例 。 所 以 ， 可 能 存在 一 个 具有 上 述 的 属性 和 
方法 的 按钮 类 。 某 个 按钮 对 象 是 按钮 类 的 一 个 实例 (instance )。 与 传统 的 程序 设计 语言 相 比 ， 
对 象 类 就 像 数据 类 型 ， 类 的 对 象 就 像 该 类 型 的 变量 。 

支持 对 象 的 语言 也 支持 继承 (inheritance )。 当 对 象 类 在 系统 中 实现 后 (可 能 由 系统 开发 
商 提供 ) ， 应 用 程序 员 可 以 实现 一 个 新 的 对 象 类 ， 它 是 原始 对 象 类 的 一 个 子 类 (child)。 子 类 
继承 其 父 类 的 所 有 属性 和 方法 ， 并 且 可 以 有 自己 另外 的 属性 和 方法 。 

例如 ， 按 钮 类 的 子 类 可 能 是 一 个 开关 按钮 类 ， 当 按 下 按钮 后 ， 按 钮 的 颜色 在 红 、 绿 之 间 
切换 产生 不 同 的 效果 。 由 于 开关 按钮 自动 继承 了 其 父 类 的 属性 和 方法 ， 因 此 设计 者 可 以 使 用 
继承 的 方法 来 绘制 和 改变 开关 按钮 的 颜色 ， 并 不 需要 理解 私有 的 图 形 属性 或 其 他 维护 图 形 显 
示 完 整 性 的 细节 。 所 以 ,继承 提供 了 一 种 手段 ， 使 得 应 用 程序 员 可 以 轻松 地 为 特定 应 用 定制 
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通用 对 象 类 。 

对 象 可 以 视 为 对 抽象 数据 类 型 《abstract data type) 的 程序 语言 概念 的 推广 。 通俗 地 说 ， 
抽象 数据 类 型 是 没有 继承 性 的 对 象 。 一 个 例子 是 内 置 在 计算 机 硬件 上 的 整数 数据 类 型 。 整 数 
有 具有 值 ( 它 的 属性 ) 和 一 些 操作 : 加 法 、 减 法 、 乘 法 以 及 除法 ( 它 的 方法 )。 它 之 所 以 被 认为 
是 抽象 数据 类 型 ， 是 因为 它 的 实现 (一 进 制 补 码 、 二 进 制 补 码 等 ) 被 封装 了 ， 对 程序 员 不 可 
见 。 大 部 分 程序 设计 语言 提供 了 其 他 的 内 置 抽象 数据 类 型 ， 这 些 数 据 类 型 不 在 硬件 中 实现 ， 
如 数组 和 记录 。 再 强调 一 次 ， 这 些 类 型 的 实现 是 封装 起 来 的 ， 对 于 使 用 它们 的 程序 员 而 言 是 
不 可 见 的 。 一 些 程序 设计 语言 允许 程序 员 定义 自己 的 抽象 数据 类 型 ， 例 如 ， 队 列 。 这 只 是 实 
现 程序 员 定义 自己 的 对 象 过 程 中 在 编程 语言 的 概念 上 取得 的 一 个 小 进步 ， 即 具有 继承 性 的 抽 
象 数据 类 型 ， 例 如 ， 作 为 队列 的 子 类 的 优先 级 队列 。 


A.1.2 客户 与 服务 器 


事务 处 理 系统 中 的 一 类 重要 模块 是 资源 管理 器 (resource manager)。 我 们 在 广义 上 使 用 
“资源 ”这 个 词 来 描述 系统 中 硬件 或 数据 ， 这 些 硬 件 或 数据 可 以 被 许多 模块 所 利用 ， 例 如 ， 数 
据 库 ， 含 有 注册 标识 符 和 相应 口令 的 注册 文件 ,不 重复 数字 源 (唯一 数 产生 器 )， 或 打印 设备 。 
“资源 管理 器 ”是 调节 资源 使 用 的 模块 。 它 封装 资源 以 及 相关 的 数据 结构 和 一 组 向 其 他 模块 进 
行 输出 的 过 程 。 这 些 过 程 是 希望 访问 这 些 资源 的 其 他 模块 可 获取 的 方法 或 抽象 操作 。 只 有 通 
过 这 些 过程 才 能 访问 资源 。 

例如 ， 管 理 数据 库 的 资源 管理 器 〈 称 为 数据 库 管理 器 (database manager) 或 数据 库 管理 
系统 (DBMS ) ) 是 允许 访问 含有 数据 库 的 大 容量 存储 器 上 区 域 的 唯一 模块 。 另 外 ， 可 能 在 它 
的 地 址 空间 中 含有 缓冲 区 来 放置 最 近 访 问 过 的 页 ,这 部 分 内 存 称 为 高 速 缓存 (cache memory ) 。 
它 可 能 提供 执行 SQL 语 句 的 服务 。 注 册 管 理 器 可 能 封装 注册 文件 并 实现 注册 新 用 户 、 变 更 日 
令 、 检 查 口令 的 服务 。 资 源 管 理 器 的 接口 在 API 中 描述 。 

资源 管理 器 为 其 他 正在 同步 执行 的 模块 提供 服务 。 所 以 ， 当 资源 管理 器 RM 正 为 某 个 模块 
MI 提供 服务 时 ， 另 一 模块 M:， 可 能 也 要 求 RM 执行 某 些 服务 。 在 最 简单 的 情形 下 ， 服 务 按 先 
进 先 出 的 方式 提供 : M; 的 服务 请 求 要 一 直 等 到 由 Mi 调用 的 过 程 返回 以 后 才能 开始 执行 。 然 而 ， 
这 种 规定 可 能 在 大 型 系统 中 引发 性 能 问题 ， 因 为 在 大 型 系统 中 ， 其 他 许多 模块 都 需要 RM 提供 
的 服务 。 顺 序 执行 事务 可 能 引起 同样 的 问题 : RM 会 成 为 瓶颈 。 允许 并 发 执行 资源 管理 器 的 过 
程 可 以 解决 上 诉 问题 。 线 程 (thread) 是 这 种 机 制 的 一 个 例子 。 我 们 在 A.3 节 讨论 线程 的 细节 
时 再 讨论 这 问题 。 l 

资源 管理 器 通常 被 称 为 服务 器 (server)。 所 以 ,我们 称 管理 数据 库 的 模块 为 数据 库 管 理 
器 或 则 数据 库 服务 器 。 调 用 服务 器 的 模块 称 为 客户 (client)。 这 些 名 字 可 能 会 信人 有 些 误解 ， 
因为 模块 通常 按 一 定 的 层次 结构 进行 组 织 。 为 一 个 模块 担当 服务 器 的 模块 可 能 用 到 其 他 模块 
的 服务 ， 在 这 种 情形 下 ， 该 模块 又 成 为 了 那些 其 他 模块 的 客户 。 

事务 处 理 系统 通常 组 织 成 客户 /服务 器 系统 。 事 务 被 客户 模块 调用 ， 当 它们 需要 访问 某 些 
资源 时 就 调用 相应 的 服务 器 模块 。 

考虑 图 A-2 所 示 的 简单 的 事务 处 理 系统 。 用 户 模块 由 一 个 控制 屏幕 上 的 信息 显示 的 显示 服 
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务 器 和 一 个 执行 应 用 程序 的 应 用 服务 器 组 成 。 数 据 库 服务 器 为 应 用 程序 执行 SQL 话 句 。 
集中 式 系统 








图 A-2 简单 的 事务 处 理 系统 


我 们 知道 ， 术 语 客户 (client) 和 服务 器 (server) 经 常用 在 不 同 的 语 境 中 。 这 里 ， 我 们 
用 这 两 个 术语 表示 存在 于 同一 计算 机 ， 或 者 不 同 计算 机 上 的 模块 。 在 其 他 的 语 境 下 ， 这 些 术 
语 可 能 指 执 行 这 些 模块 的 计算 机 。 所 以 ， 可 以 说 我 们 的 学 生 注册 系统 就 是 一 个 客户 /服务 器 系 
统 ， 其 中 客户 是 学 生 使 用 的 计算 机 ， 服 务 器 是 注册 办 公 室 的 主机 。 在 这 种 情形 下 ， 仅 当 客 户 
和 服务 器 模块 驻 留 在 不 同 的 计算 机 上 时 ， 事 务 处 理 系统 才 是 一 个 客户 /服务 器 系统 。 反 之 ， 客 
户 与 服务 器 模块 都 在 同一 计算 机 上 的 系统 不 能 被 称 为 客户 /服务 器 系统 。 为 了 区 分 这 两 种 用 法 ， 
我 们 使 用 术语 “客户 ”和 “服务 器 ”来 指示 我 们 已 经 描述 过 的 模块 结构 。 当 提 到 硬件 时 ， 我 
们 使 用 客户 机 与 服务 器 机 。 注 意 ， 客 户 / 服 务 器 结构 的 一 个 特点 (也 是 它 的 优势 之 一 ) 是 它 可 
以 轻松 地 在 单 台 机 器 上 或 计算 机 网 络 上 实现 。 


A.2 多 道 程序 的 操作 系统 


现代 计算 机 系统 包含 多 个 独立 的 可 同时 执行 的 处 理 器 。 例 如 , ,中 央 处 理 器 (CPU) 和 LO 
处 理 器 (有 时 称 为 信道 )。 单 处 理 器 系统 (uniprocessor system) 有 一 个 CPU， 而 多 处 理 器 系 
统 (multiprocessor system) 有 多 个 CPU。 传 统 的 多 处 理 器 系统 的 所 有 处 理 器 共享 一 个 公共 主 
存 ， 所 以 它 也 称 为 共享 内 存 系统 (shared memory system). 这 种 体系 结构 的 一 个 变 体 是 其 中 
的 每 一 个 CPU 都 有 自己 的 秋 有 主 存 并 且 仅 共享 大 容量 存储 器 。 这 种 系统 称 为 磁盘 共享 系统 
(shared disk system ) 。 

还 有 一 种 无 共享 系统 (shared nothing system)， 即 不 同 的 计算 机 系统 通过 通信 线路 互 连 起 
来 。 每 一 个 系统 都 是 设备 齐全 的 ， 它 们 具有 自己 的 私有 主 存 和 大 容量 存储 设备 ,无 任何 共享 。 
这 种 体系 结构 的 一 类 变 体 是 ， 同 类 的 个 体系 统 被 包装 在 同一 个 单元 中 。 每 一 个 系统 都 构建 在 
同样 的 硬件 上 ， 被 同一 操作 系统 的 拷贝 控制 ， 并 且 通 过 高 速 连接 (如 ， 总 线 ) 进行 通信 。 在 
另 一 类 变 体 中 ,个 体系 统 是 一 个 分 布 式 系统 (distributed system) 的 一 部 分 。 分 布 式 系统 一 般 
包括 异 构 硬件 和 软件 ， 它 们 可 能 是 地 理 寺 分布 的 ， 进 行 低速 通信 (可 能 通 进 电话 线路 )。 我 们 
在 下 一 节 会 讨论 这 样 的 系统 。 

操作 系统 (operating system) 是 管理 计算 机 系统 资源 的 程序 。 这 些 资源 包含 在 系统 处 理 
器 上 的 执行 时 间 ， 存 储 空间 ， 对 物理 设备 ; (如 大 容量 的 存储 设备 或 通信 线路 》 的 访问 。 操 作 
系统 也 可 能 管理 信息 资源 ， 如 文件 系统 。 操 作 系统 的 目标 之 一 是 高 效 地 使 用 这 些 资 源 。 

由 操作 系统 控制 的 用 户 与 系统 任务 以 进程 方式 执行 。 进 程 (process) 是 可 以 存 取 某 些 数 
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据 的 正在 执行 的 程序 。 存 储 在 程序 的 虚拟 内 存 中 的 数据 可 以 直接 被 程序 访问 ， 数 据 也 可 以 存 
储 在 文件 中 ， 通 过 操作 系统 访问 。 另 外 ， 数 据 可 以 是 全 局 性 的 或 局 部 性 的 。 全 局 性 数据 能 够 
被 进程 执行 的 所 有 过 程 访 问 ， 当 特定 的 过 程 开始 执行 时 可 以 动态 生成 局 部 数据 ， 并 且 当 过 程 
返回 时 释放 这 些 数据 。 局 部 数据 一 般 存 储 在 堆栈 中 ， 并 且 组 成 过 程 的 参数 和 局 部 变量 。 程 序 
和 所 有 可 以 被 它 访 问 的 数据 都 存在 于 进程 的 数据 空间 (data space) 中 。 

在 最 简单 的 情形 下 ， 每 一 个 进程 有 一 个 控制 点 ， 即 将 要 执行 的 下 一 条 指令 的 地 址 (我 们 
在 A.3 节 考察 具有 多 个 控制 点 的 进程 )。 控 制 点 与 其 数据 空间 中 的 变量 的 值 合 称 为 进程 的 状态 
(state). 

在 单 道 程 序 (uniprogrammed) 的 操作 系统 中 ， 一 个 进程 在 其 他 进程 开始 之 前 可 以 一 直 运 
行 到 结束 。 这 不 能 充分 利用 系统 资源 ， 因 为 许多 程序 被 设计 成 一 次 只 能 利用 一 个 物理 处 理 器 。 
例如 ,程序 在 计算 (请求 CPU) 和 与 文件 交换 信息 (请 求 O 处 理 器 ) 之 间 进行 轮换 。 在 计算 
阶段 ，LO 设 备 空间 ， 而 在 IO 阶段 ，CPU 空 闲 。 

有 效 地 利用 计算 机 系统 要 求 使 尽 可 能 多 的 物理 CPU 处 于 忙 的 状态 。 为 了 达到 目标 ， 理 想 
的 方法 是 同时 执行 多 个 进程 。 进 程 在 一 个 特定 的 时 间 点 可 能 仅 从 一 个 (或 者 ， 可 能 一 小 部 分 ) 
处 理 器 请 求 服务 。 但 是 ， 如 果 许 多 进程 同时 执行 ， 就 可 以 同时 利用 许多 处 理 器 ， 从 而 提高 系 
统 的 吞吐 量 。 能 够 同时 执行 多 个 进程 的 操作 系统 被 称 为 多 道 程 序 (multiprogrammed ) 的 操作 
系统 。 

从 用 户 观点 看 ， 并 发 执行 是 重要 的 ， 因 为 为 一 个 用 户 提供 服务 的 进程 不 需要 等 到 为 另 一 
个 用 户 提 供 服务 的 进程 结束 后 才能 开始 ， 就 如 同 在 单 道 程序 系统 中 一 样 。 结 果 是 改进 了 系统 
的 响应 时 间 。 . 

并 发 在 同时 为 数 千 个 用 户 服务 的 事务 处 理 系统 中 特别 重要 。 通 过 事务 的 并 发 执行 ， 计 算 
机 系统 固有 的 能 力 可 以 在 减少 单个 事务 的 响应 时 间 ， 同 时 提高 系统 的 吞吐 量 。 

事实 上 ， 尽 管 进程 共 享 那些 由 操作 系统 分 配 的 现 有 资源 (包括 CPU 时 间 、 存 储 空 间 、LIO 
处 理 器 的 服务 请 求 等 )， 但 在 多 道 程序 操作 系统 控制 下 执行 的 每 个 进程 看 起 来 就 像 在 自己 的 机 
器 上 执行 一 样 。 操 作 系 统 允 许 一 个 进程 P| 执行 一 段 时 间 ， 称 为 时 间 片 (time quantum), ja. 
中 断 P, 让 另 一 个 进程 P: 执 行 ， 从 而 促使 CPU 被 共享 。 忆 可 以 在 随后 的 时 间 继 续 执行 。 这 产生 了 
一 种 称 为 交叉 执行 〈interleaved execution) 的 现象 。 在 多 处 理 器 系统 中 ， 每 个 CPU 都 按 这 种 
方式 共享 。 

如 果 P 和 了 P: 的 数据 空间 是 不 相交 的 ， 那 么 它们 的 执行 就 不 会 受到 交叉 执行 的 影响 。P; 分 辩 
不 出 它 已 经 被 中 断 了 ， 因 为 当 它 继续 执行 时 ， 它 的 数据 空间 的 状态 与 其 被 中 断 前 的 状态 是 完 
全 一 致 的 ? 。 数 据 空 间 并 不 一 定 是 不 相交 的 ， 然 而 ， 可 能 出 现 交友 。 一 种 极端 的 情形 是 ， 数 

空间 的 交 双 可 能 被 限制 在 大 容量 存储 器 的 文件 上 。 但 是 操作 系统 也 允许 处 理 虚 拟 内 存 中 的 
共享 部 分 。 任 何 情形 下 ， 操 作 系 统 负责 确保 每 一 个 进程 只 能 够 访问 自己 数据 库 空 间 中 的 信息 。 

如 果 P1 和 P; 的 数据 空间 不 是 不 相交 的 ， 那 么 这 些 进 程 共 享 访问 交集 中 的 数据 项 。 如 果 P, 中 
断 了 P,， 并 且 改 变 了 交集 中 的 一 个 数据 项 的 值 ， 则 P, 被 中 断 时 的 数据 空间 的 状态 与 其 随后 继续 
执行 时 的 状态 将 不 完全 一 致 ， 所 以 P, 的 执行 可 能 受到 交叉 执行 的 影响 。 例 如 ， 如 果 P: 向 P 读 取 


O ”这 里 我 们 很 设 进程 不 访问 系统 时 钟 。 如 果 能 检测 时 间 的 流逝 ， 进 程 就 能 分 辨 出 自己 已 经 被 中 断 了 。 
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的 数据 项 写 入 新 值 , 则 P, 是 在 读 取 数据 之 前 还 是 之 后 被 Ps 所 中 断 ， 决定 了 返回 给 P! 的 值 。 注意 ， 
进程 不 能 控制 中 断 何 时 发 生 ， 这 由 操作 系统 在 其 资源 分 配 例 程 中 决定 。 所 以 ， 同 样 的 两 个 进 
程 的 不 同 次 执行 ， 其 交叉 操作 可 能 会 不 同 。 这 意味 着 ， 如 果 数 据 空间 相交 ， 则 其 进程 可 能 在 
不 同 的 执行 中 具有 不 同 的 表现 。 

我 们 在 第 23 章 的 事务 隔离 性 中 对 交叉 执行 带 来 的 影响 进行 了 讨论 ， 并 且 指 出 事务 的 不 同 
表现 由 它们 的 数据 库 操作 如 何 交叉 进行 所 决定 。 这 里 ， 共 享 的 数据 空间 是 指数 据 库 (不 同事 
务 的 工作 空间 没有 交集 )。 


A.3 线程 


在 多 道 程序 的 操作 系统 中 ， 线 程 管理 是 一 个 复杂 的 问题 。 操 作 系统 必须 维护 其 表 中 关于 
每 个 进程 的 相当 数量 的 信息 ， 这 需要 使 用 大 量 的 内 存 。 这 些 信息 包括 进程 可 以 使 用 的 资源 总 
量 (如 计算 时 间 )， 目 前 的 使 用 量 (出 于 计数 和 调度 的 目的 ) ， 虚 拟 内 存 目前 所 在 的 位 置 〈 即 
其 在 主 存 或 大 容量 存储 器 中 的 物理 地 址 )， 调 度 的 优先 级 ， 可 以 访问 的 文件 (因此 进程 和 用 户 
都 可 以 受到 保护 )， 等 等 。 另 外 ， 这 些 表 会 被 频繁 地 扫描 ， 使 得 操作 系统 占用 了 大 量 的 计算 时 
间 。 例 如 ， 系 统 不 得 不 频繁 扫描 进程 表 来 确定 进程 的 执行 顺序 。 

由 多 道 程序 操作 系统 引起 的 空间 与 时 间 的 开销 是 它 所 支持 的 处 理 器 数量 的 函数 ， 因 此 处 
理 器 的 数量 受到 了 限制 。 这 种 限制 提出 了 对 低 开 销 进程 的 需求 ， 并 导致 了 线程 和 多 线程 进程 
的 发 展 。 

传统 的 (或 单线 程 (single-threaded)) 进程 只 有 一 个 控制 点 。 当 持续 执行 时 ， 控 制 点 从 
一 条 指令 或 IO 操作 转移 到 另 一 条 指令 或 IO 操作 ， 并 且 定义 了 一 条 执行 路 径 。 执 行 是 顺序 
(sequential) 进行 的 ， 这 意味 着 在 任何 给 定 的 时 间 ， 进 程 的 状态 决定 了 下 面 将 要 执行 的 唯一 的 
FES ROE. SRA (multithreaded) 进程 包含 多 个 控制 点 ， 它 们 定义 了 称 为 线程 (thread) 
的 独立 执行 路 径 。 如 果 操 作 系统 支持 线程 ， 它 为 线程 分 配 CPU 的 方法 与 为 进程 分 配 CPU 的 方 
法 一 样 。 这 样 ， 进 程 中 的 线程 就 能 够 并 发 执行 。 

由 于 在 任何 给 定 的 时 间 ， 在 多 线程 进程 中 需要 执行 的 下 一 条 指令 可 能 是 它 的 任何 一 个 线 
程 的 下 一 条 指令 ， 所 以 从 总 体 上 看 ， 进 程 的 执行 不 再 是 顺序 的 。 同 样 ， 因 为 每 一 个 线程 的 控 
制 点 可 以 指向 任何 指令 ， 所 以 几 个 线程 可 能 同时 执行 同一 个 过 程 。 进 程 中 的 每 一 个 线程 都 有 
权 访 问 进程 的 数据 库 空间 中 的 全 局 信息 〈 数 据 和 过 程 ) 以 及 存放 局 部 数据 的 线程 私有 堆栈 。 

操作 系统 管理 含 a 个 线程 的 多 线程 进程 的 开销 明显 低 于 管理 4 个 进程 的 开销 。 

。 操 作 系 统 从 总 体 上 为 进程 维护 一 个 数据 空间 描述 。 

“操作 系统 从 总 体 上 考虑 进程 对 资源 的 利用 。 

。 进 程 中 的 所 有 线程 共享 对 文件 、 设 备 等 的 访问 路 径 。 

。 操 作 系 统 可 以 把 程序 的 执行 从 进程 中 的 一 个 线程 切换 到 另 一 个 线程 ， 而 不 会 出 现 进程 之 

间 开 销 昂 贵 的 运行 环境 切换 (context switch). 

多 线程 的 优势 需要 付出 代价 。 线 程 必须 被 谨慎 地 规划 以 同步 它们 对 进程 内 全 局 数据 的 访 
问 。 而 且 ， 在 进程 中 执行 的 线程 之 间 没 有 内 存 保护 ， 所 以 一 个 线程 执行 中 的 错误 可 以 破坏 数 
据 空 间 中 的 所 有 其 他 线程 的 信息 。 

应 用 服务 器 是 可 以 被 多 线程 化 的 模块 的 一 个 例子 。 当 用 户 在 客户 机 上 注册 后 ， 应 用 服务 
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器 上 就 建立 一 个 进行 相应 的 处 理会 话 。 每 一 个 会 话 都 有 相关 的 局 部 数据 用 于 处 理 用 户 的 请 求 
(如 用 户 的 姓名 和 1d )。 会 话 可 能 会 持续 相当 长 的 一 段 时 间 ， 因 为 用 户 可 能 想 执行 一 系列 的 交 
互 ， 每 个 交互 一 般 都 需要 与 用 户 通 信 。 例 如 ， 许 多 学 生 可 能 同时 使 用 注册 系统 进行 数 门 课 程 
的 注册 。 结 果 ， 很 多 会 话 可 能 会 同时 进行 ， 因 此 把 整个 进程 致力 于 处 理 一 个 会 话 将 导致 处 理 
的 低 效 。 而 应 用 服务 器 中 的 线程 可 以 通过 存储 在 其 私有 堆栈 中 的 局 部 信息 与 每 一 个 会 话 关联 
起 来 。 


A.4 通信 


多 道 程 序 操作 系统 通常 可 以 使 进程 间 的 相互 通信 成 为 可 能 。 所 以 ， 系 统 允 许 这 样 的 可 能 
性 : 进程 不 是 各 自 代表 不 同 的 用 户 进 行 分 离 的 或 互 不 相关 的 计算 ， 而 是 合作 完成 一 些 复杂 的 
任务 。 例 如 ， 一 个 二 维 空间 上 的 复杂 的 科学 计算 可 以 分 解 为 在 不 同 的 空间 区 域 上 的 数 个 计算 ， 
其 中 每 一 个 计算 都 被 单独 的 进程 执行 。 在 一 个 含有 几 TB 字 节 信 息 的 数据 库 上 进行 的 查询 可 能 
被 分 配 到 不 同 进程 的 许多 查询 器 中 进行 。 在 这 些 情况 下 ， 协 作 的 进程 之 间 需 要 进行 通信 。 

共享 内 存 体系 结构 中 进程 间 通 信和 的 一 种 方法 是 通过 它们 的 数据 空间 的 共享 区 进行 通信 。 
一 个 进程 可 以 在 一 些 共享 位 置 写 一 条 消息 ， 另 一 个 进程 可 以 在 随后 进行 读 取 。 类 似 地 ， 进 程 
可 以 只 访问 它们 的 数据 空间 的 共享 部 分 的 公共 数据 结构 ， 以 便 一 个 进程 可 以 观察 到 其 他 进程 
对 数据 的 修改 。 一 组 线程 也 可 以 按 这 种 方式 通信 。 如 果 进 程 交互 密切 ， 并 且 有 相当 数量 的 信 
息 交 换 ， 那 么 采用 这 种 通信 方式 特别 有 效 。 

共享 内 存 是 一 种 开销 非常 低 的 通信 技术 。 然 而 ， 它 自身 也 存在 问题 。 

* 必须 为 进程 提供 一 些 机 制 来 同步 它们 对 共享 数据 的 访问 。 例 如 ， 消 息 的 读 取 方 直到 写 入 

方 的 写 人 完成 后 才能 开始 读 取 。 类 似 地 ， 当 进程 更 新 数据 结构 时 ， 更 新 过 程 中 所 产生 的 

中 间 状 态 可 能 还 没有 彻底 形成 。 所 以 ， 如 果 两 个 进程 试图 并 发 访问 一 个 数据 结构 ， 并 且 

至 少 一 个 是 执行 更 新 ， 则 其 中 之 一 或 二 者 都 可 能 出 现 运行 错误 。 访 问 数据 结构 的 代码 段 

被 称 为 关键 段 (critical section ) 。 与 访问 公共 数据 库 项 的 事务 需要 被 隔离 一 样 ， 对 数据 

段 的 访问 也 需要 被 隔离 。 这 类 隔离 通常 被 称 为 互 斥 (mutual exclusion), ， 并 且 我 们 说 临 

界 区 的 执行 必须 互 斥 。 

* 共享 内 存在 分 布 式 系统 中 并 不 普遍 ， 进 程 往往 存在 于 无 共享 数据 空间 的 不 同 的 计算 机 上 。 

为 了 克服 这 些 问题 ， 多 道 程序 操作 系统 提供 了 进程 间 通 信 工 具 (Interprocess 
Communication Facility，IPC )， 人 允许 进程 使 用 send 和 receive 操 作 进 行 消 息 交 换 。 进 程 Pj 可 以 
调用 send， 指 定 另 一 个 进程 P, 接 收 它 创建 的 一 条 消息 。P; 可 以 调用 receive 表 示 它 愿意 接收 发 送 
给 它 的 下 一 条 消息 。 从 被 发 送 直 到 被 接收 ， 消 息 一 直 高 速 组 存在 操作 系统 中 ， 所 以 发 送 者 和 
接收 者 不 需要 任何 共享 内 存 。 | 

网 络 中 的 计算 机 通过 通信 线路 相互 连接 。 就 操作 系统 来 说 ， 通 信 线 路 是 一 种 新 型 的 1O 设 
备 。 为 了 支持 分 布 式 应 用 的 发 展 ， 每 台 计 算 机 的 操作 系统 中 实现 的 IPC 被 扩展 为 允许 处 于 网 络 
任何 位 置 的 进程 都 可 以 使 用 统一 的 方式 交换 消息 。 所 以 ， 无 论 进程 是 否 在 同一 台 机 器 上 ， 它 
们 都 可 以 用 同样 的 命令 进行 通信 。 这 类 系统 称 为 分 布 式 消息 传递 内 核 ( distributed message- 
passing kernel)。 因 为 每 一 台 机 器 并 不 必 直 接 与 其 他 机 器 相连 ， 所 以 存储 -转发 (store-and- 
forward) 策略 得 到 了 利用 。 消 息 通过 从 发 送 端 经 中 间 机 器 到 达 接 收 端 。 路 线 由 在 内 核 上 执行 
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的 分 布 式 算法 决定 。 

通常 有 数 个 级 别 的 消息 传递 服务 提供 给 用 户 ， 最 基本 的 是 数据 报 (datagram )。 这 样 ， 在 
发 送 端 机 器 上 的 操作 系统 在 消息 发 送 到 网 络 后 不 再 保存 消息 的 记录 。 如 果 消 息 丢 失 (HFA 
统 失败 或 中 间 机 器 的 资源 不 足 )，、 接 收 端 不 会 知道 消息 已 丢失 。 尽 管 未 必 会 有 丢失 发 生 ， 但 是 
由 于 这 个 原因 ， 数 据 报 被 认为 (相对 地 ) 不 太 可 靠 。 因 特 网 协议 (IP) 是 提供 数据 报 服务 的 
协议 的 一 个 范例 。 

HEIER A Bebe HEA READS (virtual circuit) 更 为 可 靠 。 在 这 种 情形 下 ， 发 送 端 将 保留 
消息 的 一 个 拷贝 直到 消息 被 接收 端 确认 、 如 果 消 息 丢 失 则 发 送 端 可 以 重新 发 送 。 构 建 在 IP 之 
上 的 传输 控制 协议 (TCP) 是 提供 虚拟 电路 服务 的 协议 的 范例 。UNIX 和 Windows 的 套 接 字 
(socket) 结构 是 分 布 式 消息 发 送 核 的 用 户 接口 ， 提 供 数据 报 和 虚拟 电路 服务 。 

对 等 计算 和 第 22 章 描述 的 远程 过 程 调用 通信 (RPC) 都 可 以 构建 在 分 布 式 消息 传送 内 核 提 
供 的 消息 发 送 服务 之 上 。 例 如 ， 当 一 个 远程 过 程 调用 产生 后 ， 调 用 端 ( 发送 端 ) 发 出 一 条 包含 
被 调用 端 (接收 端 ) 自 变量 的 消息 ， 并 且 执 行 一 个 接收 来 等 待 响应 。 当 (远程 )》 过 程 结束 后 ， 
被 调用 端 发 送 一 个 包含 执行 结果 的 响应 消息 给 调用 端 。 类 似 地 ， 对 等 通信 是 在 操作 系统 级 提供 
的 增强 型 的 消息 发 送 机 制 。 其 中 一 方面 增强 是 22.4.2 节 描述 的 事物 同步 机 制 (同步 点 )。 

与 共享 存储 通信 相反 ， 分 布 式 系统 中 普遍 使 用 消息 传递 。 它 也 解决 了 与 共享 内 存 有 关 的 
同步 问题 。 例 如 ， 数 据 结构 可 以 由 单个 服务 器 来 管理 ， 而 不 是 由 客户 进程 直接 访问 共享 数据 
结构 。 服 务 器 从 客户 处 接受 消息 (使 用 对 等 通信 或 RPC) 并 且 一 次 一 个 地 进行 处 理 ， 这 些 消 
息 描 述 了 被 请 求 的 访问 。 如 果 服 务 器 是 单线 程 的 ， 那 么 不 存在 对 数据 结构 的 并 发 访问 以 及 同 
步 问题 。 如 果 是 多 线程 服务 器 ， 那 么 线程 对 数据 结构 的 访问 必须 被 同步 。 受 通信 开销 (包含 
那些 与 发 生 在 系统 缓冲 区 、 发 送 端 、 接 收 端的 地 址 空间 之 间 的 消息 拷贝 相关 的 开销 ) 以 及 与 
传递 消息 相关 的 通信 延迟 的 制约 ， 消 息 传 递 只 适用 于 进程 间 松 散 交 互 ， 并 且 通 信 的 信息 量 比 
较 小 的 情形 。 ' l 
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